حدف ٨٤
حدف ٨٤ مجموعه حروف گسسته دستنويس فارسي است كه به منظور طراحي، توسعه، ارزيابي سيستمهاي ICR فارسي و به سفارش شورايعالي اطلاع رساني، تهيه شده است. در این بانک اطلاعاتی، ۱۰۲۳۶۰۴۰ نمونه تصویر از حروف دستنویس گسستهً فارسی وجود دارد. کل بانک به ۵۱ مجموعه تفکیک شده است که تعداد نمونههای هر مجموعه تقریباً ۲۰۰۰۰۰ نمونه میباشد.
حجم هر مجموعه بالغ بر GB 2٫4 است که توسط نرمافزار فشردهسازی BZ2 فشرده شده است تا به حجم یک CD برسد. حجم کل (غیر فشرده) مجموعه حدود GB ۱۲۰ است. این بانک اطلاعاتی به صورت فشرده و در قالب ۸ حلقه DVD یا ۵۱ حلقه CD قابل عرضه میباشد. ويژگيهاي مهم اين بانك به شرح زير است.
- نوع: حروف دستنویس گسسته فارسی (منظور از حروف گسسته، حروف تنها یا شکل آخر سایر حروف و ارقام فارسی میباشد.)
- منبع جمعآوري اطلاعات: نمونههای موجود در این مجموعه از فرمهای ثبت نام آزمون ورودی مراکز آموزشی راهنمایی و دبیرستان سازمان ملی پرورش استعدادهای درخشان (سمپاد) در سالهای۸۴-۸۳ و ۸۵-۸۴ استخراج شدهاند.
- نوع فایل تصاویر: BMP
- ابعاد: (pixel ۹۵ × ۷۷) mm 8٫04 × 6٫52
- ریزبینی: dpi ۳۰۰
- اطلاعات موجود در فایل XML هر CD: در فایل XML موجود در هر CD برای هر نمونه توضیحاتی به شرح زیر وجود دارد: نام فایل، مسیر فایل پس از بازکردن فایل فشرده، کلاس فایل (شماره شاخهای که فایل در آن قرار دارد)، جنسیت نویسنده ، شهر نویسنده، نوع کلمهای که حرف از آن استخراج شده، عددی که نشان میدهد حرف مورد نظر، حرف چندم کلمه مذکور است، نام اسکنر، شماره مشخصه نویسنده و فیلدی که نشان میدهد این کاراکتر جزء مجموعه آموزش یا آزمون است.
|