قالب وردپرس افزونه وردپرس
خانه / یادداشت مدیر
هادی قربانی - مدیر سایت ایپابفا

یادداشت مدیر

سه شنبه ۹۸/۰۷/۲۳

اعتماد کاربران به سایت ها

امروز دریافتم یکی از مهمترین عوامل پیشرفت یک سایت «قابل اعتماد» بودن آن است. یعنی جدای از مطالب اختصاصی، ظاهر سایت، سئو، کلمات کلیدی ووو ، کلیت سایت و مدیریت آن باید چنان اعتماد مخاطب را جلب کند که کاربر هنگام ورود به سایت و مطالعه مطالب سایت احساس راحتی و اعتماد کند و دوست داشته باشد باز هم به سایت سر بزند.

اگر کاربر به سایت اعتماد نداشته باشد، ترجیح می دهد موضوع مورد علاقه خود را در سایت دیگری که با ان احساس راحتی می کند بخواند یا کالای مورد نظر خود را از آن سایت تهیه کند.

چه چیزهایی موجب جلب اعتماد مخاطب می شود؟

فکر می کنم مخاطبان در وهله اول به «ظاهر» و «محتوای سایت» توجه می کنند. هر مخاطبی در نگاه اول متوجه می شود آیا سایتی که وارد آن شده یک سایت حرفه ای است یا یک سایت تازه کار؟ آیا مطالب آن اختصاصی است یا کپی پیست؟ نوشته های سایت چگونه ارائه شده؟ آیا نویسنده سایت با اصول نگارش و نویسندگی آشناست؟ کاربر، با برآورد معیارهای فوق، در کسری از ثانیه تصمیم خود را برای ماندن می گیرد یا بلافاصله سایت را ترک خواهد کرد.

نوع سایت

نوع سایت هم در قابل اعتماد بودن آن تاثیرگذار است. بعضی ها ممکن است مطالب وبلاگ ها را ترجیح دهند چون وبلاگ ها «شخصی تر» و «بی تعارف تر» هستند و مطالب آن هم بیش از آنکه برای جذب ترافیک باشد، بیشتر حالت «دل نوشته» دارد و وبلاگ نویس برای دل خودش نوشته یا مطلب گذاشته .اما متاسفانه سایت ها عمدتاً اینگونه نیستند. سایت ها کاربری تجاری دارند و خیلی از مدیران سایت ها دست به هرکاری می زنند تا ترافیک سایت خود را بالا ببرند و نتیجه، قربانی شدن محتوا است. چنین سایت هایی برای بالا بردن ترافیک خود دست به کپی پیست می زنند و نهایتاً در یک غروب سرد پاییزی که می بینند هنوز به جایگاهی نرسیده اند، نومیدانه دست از کار می کشند و سایت را رها می کنند و می روند… همین عامل باعث شده کاربران هم به سایت های تازه کار و ناآشنا اعتماد نکنند و بیشتر به سراغ سایت هایی بروند که نام و شهرت و مخاطبانی دارند.

آیا ایپابفا قابل اعتماد است؟

من این سایت را سال ۲۰۱۴ راه اندازی کردم. خیلی پوسته و قالب عوض کردم و خیلی ایده ها را روی آن امتحان کردم. در این مدت اتفاقات زیادی برای سایت افتاد. بخاطر اینکه تازه کار بودم و خیلی از سایت داری سر درنمی آوردم بارها سایت از کار افتاد، به علت اختلال افزونه ها صفحه سفید مرگ ناامیدم کرد، حتی یکبار هاست سرور در شرکت میزبان بکلی از کار افتاد (که البته نسخه پشتیبان آن چند ساعت بعد دوباره روی شبکه قرار گرفت.)

سایت ایپابفا برایم خیلی مهم بود. خیلی وقت روی محتوای آن گذاشتم. ۵ سال این سایت را با همه ضعف ها و مشکلات نگه داشتم اما دیگر از ایده قبلی خسته شده بودم. قبلاً دلم می‌خواست سایت کتاب الکترونیک راه اندازی کنم و همین کار را هم کردم اما ابزار فنی کافی برای این کار را نداشتم. خودم محتوا را تولید می کردم و برای دانلود می گذاشتم.

در طول این مدت، سایت کتاب «فیدیبو» راه اندازی شد، پیشرفت کرد و به جایی رسید که دیجیکالا آن را خرید اما هنوز تعداد کتاب ها من به ۲۰۰ کتاب نرسیده بود. من خیلی سال ها پیش از فیدیبو، ایده نشر کتاب الکترونیکی را داشتم و عملی کردم اما چون سرمایه کافی نداشتم به جایی نرسیدم. حتی یکبار به اداره ارشاد رفتم تا برای «نشر الکترونیک» مجوز بگیرم. می خواستم سایتی راه اندازی کنم که افراد متقاضی چاپ کتاب و ناشران به جای چاپ نسخه کاغذی، نسخه الکترونیکی کتاب خود را مجوز بگیرند و منتشر کنند. اما نشد که نشد. نه سرمایه داشتم و نه جسارت اینکه دنبال سرمایه گذار بروم.

دنیای اندیشه های من خیلی کوچک است. همیشه خواسته ام با کمترین امکانات، بهترین کیفیت را تولید کنم و این ایده، اگرچه خیلی خوب است اما بسیار کند و زمانبر است. گاهی اوقات انسان برای پیشرفت به یک «شتاب دهنده» نیاز دارد. به یک نفر که بیاید و هل ات بدهد تا تندتر حرکت کنی. اما من جسارتش را نداشتم. برای همین ۵ سال کسی «ایپابفا» را جدی نمی گرفت و حتی می گفتند ایپابفا دیگر چه کلمه ای است! حال برویم سر سوال اصلی:

آیا ایپابفا قابل اعتماد است؟

در یک غروب سرد پاییزی، من هم مثل خیلی از مدیران سایت های دلشکسته، ناامیدانه به سراغ سایتم رفتم، وارد هاست میزبان شدم و با یک کیلک، هاست را «ریست» کردم. دیگر از دست ایده های دست نیافتنی ام خسته شده بودم، از دست خرابی های سایت، از دست «داون» شدن های سایت و از دست محتوای سایت که احساس می کردم نوعی کپی برداری تجاری است. همه چیز را پاک کردم و برگشتم به نقطه صفر .

وقتی یک سایت از فضای اینترنت حذف می شود یعنی اینکه دیگر قابل اعتماد نیست. خودم هم می دانم. اما من دیوار کجی ساخته بودم و این دیوار تا ثریا داشت کج می رفت. باید یک روزی درستش می کردم و این درست کردن «جسارت» می خواهد.

دنبال یک ایده بهتر بودم. ایده ای که بهتر از پس آن برآیم و ابزار تولید محتوای ان را هم داشته باشم. به قول یکی از سایت های کسب و کار اینترنیت «به خودت نگاه کن ببین چه کاری بلدی و چه محتوایی می توانی تولید کنی.» من هم به خودم نگاه کردم و دیدم تنها کاری که بلدم «ترجمه و تایپ کردن» است. ترجمه که جوابگوی کارم نبود چون می خواستم سریعتر رشد کنم نه اینکه سه ماه وقتم را صرف ترجمه و تایپ یک کتاب کنم. بنابراین فقط «تایپ» کردن ماند. شروع کردم. اولین قصه را کار کردم. خوشم آمد. از خواندن قصه ها لذت می بردم. برای همین تصمیم گرفتم روی قصه و داستان کار کنم.

کپی رایت

اگر قرار بود کارم را خوب انجام دهم باید طوری جلو می رفتم که فردا کسی مدعی نشود. برای همین یک محدوده کاری برای خودم مشخص کردم. دور کتاب های جدید را خط کشیدم و به سراغ کتاب های قدیمی رفتم، عمدتاً کتاب های پیش از انقلاب. کتاب هایی که به نوعی «خاطره انگیز» و «نوستالژیک» بودند. قانون کپی رایت در ایران بین ۳۰ تا ۵۰ سال است. اما فکر می کنم کتابی که ۲۵ سال پیش چاپ شده و نایاب شده و دیگر یادی از ان نمی شود، به نوعی از گردونه کپی رایت خارج شده و شاید نویسنده ان خوشحال هم بشود که یکی پیدا شود و اسمش را دوباره زنده کند. درست است که قانون، سلیقه ای نیست اما به خودم اجازه دادم کتابهای دهه ۶۰ به قبل را کار کنم. بنابراین، بیشتر قصه ها و داستان های سایت مربوط به دهه ۶۰، ۵۰، ۴۰ و ۳۰ خورشیدی است و اگر کتابی از دهه ۷۰ به بعد در سایت قرار گرفته باشد حتماً اشبتاهی شده و اگر کسی گزارش بدهد پاکش می کنم.

مَخلص کلام اینکه نمی دانم آیا کاربران به سایت ایپابفا اعتماد دارند یا نه. چون این را باید از کاربران سایت بپرسم. اما وقتی به آمارها مراجعه می کنم برای خودم یک چیزهایی حدس می زنم.

الکسا چه می گوید؟

سایت الکسا می گوید نرخ ترافیک سایت من تا امروز ۵% است یعنی خیلی بد. اما خوب، سایت من تازه ۳ ماه است که راه افتاده و نمی توان توقع داشت که همین حالا گوی سبقت را از رقبا برباید. اما در عوض، «نرخ پرش» سایت ۲۷% است یعنی خیلی خوب. یعنی اینکه ۷۳% کاربران بعد از ورود به سایت ترجیح داده اند در سایت بمانند و گشت و گذاری بزنند و کتابی بخوانند و فقط ۲۷% از کاربران بعد از ورود به سایت خیلی زود از سایت خارج شده اند. مقدار زمان روزانه سایت ۴۵ دقیقه است یعنی خیلی خوب. یعنی طبق آمار سه ماهه الکسا، هر کاربر بطور میانگین ۴۵ دقیقه در سایت حضور داشته و به تماشا و مطالعه مشغول بوده . میانگین نرخ بازدید روزانه هر کاربر ۱۶ صفحه است. یعنی ۱۶ تا قصه و داستان می خواند یا عکس هایش را تماشا می کند. نکته جالبتر و باحال تر، راجع به قیمت سایت است. قبلاً هرچه روی سایت ها کار می کردم نهایتاً ارزششان ۱ تا ۲ دلار بود اما در این ۳ ماه که روی مطالب اختصاصی کار کرده ام ارزش سایت به ۱۴۰۰۰ دلار رسیده است که برایم باورنکردنی است. اولش می گفتم این ارزش گذاری هم «الکی» است اما وقتی به چند سایت سرشناس مراجعه کردم دیدم قیمت ها خیلی نزدیک به هم است. البته یکی از سایت ها هم همیشه سایتم را ۱۰ دلار قیمت می گذارد اما این دیگر بی انصافی است چون یک روز چرتکه برداشتم و حساب کردم اگر همه قصه ها و داستان های سایت را به یک تایپیست سپرده بودم، حدوداً ۵ میلیون تومان پول تایپش می شد. این یعنی حدوداً ۴۰۰ دلار . بنابراین عدد ۱۰ دلار قابل اعتماد نیست. اما سایت urlrate.com بیشتر به آدم امید می دهد.

قیمت گذاری سایت ایپابفا توسط urlrate.com

البته این قیمت گذاری بیشتر جنبه معنوی دارد تا مالی و خیلی نمی شود رویش حساب کرد اما در حد خودش امیدوارکننده است و بالاخره آدم می فهمد که «هی، سایت ما هم انگار یک تکانی خورده.»

با این اوصاف، فکر می کنم کاربران کم کم بتوانند به ایپابفا اعتماد کنند و حسابی رویش باز کنند.

سه شنبه ۹۸/۰۷/۱۶

یک سایت خوب برای تبدیل فایل های پی دی اف متنی و اسکن به ورد

امروز همینطور که مشغول جستجو در وب بودم با یک سایت «تبدیل پی دی اف به ورد» به نام «ایبو» آشنا شدم که با هزینه اندک هر نمونه پی دی اف را به ورد تبدیل می کرد. سرویس این سایت آنلاین است و خروجی آن بسیار سریع است.

صفحه تبدیل سایت ایبو

یک نمونه فایل آماده را که قبلاً ocr کرده بودم، توی این سیستم آزمایش کردم و دیدم کیفیت بسیار خوبی دارد. شاید اگر ۴ ماه پیش به چنین سایتی برمی خوردم از خوشحالی خیلی مشعوف می شدم. اما توسعه دهندگان ایرانی آنقدر لفتش دادند که دیگر ذوق زده نمی شوم.

خروجی متن سایت، خیلی خوب بود اما بعد که نظرات کاربران را خواندم و با مشکلات آنها آشنا شدم، متوجه شدم که «آماده سازی پی دی اف پیش از عملیات OCR» خیلی مهم است و کیفیت خروجی، به کیفیت ورودی آن وابسته است.

به هر صورت، تبدیل پی دی اف متنی یا اسکن فارسی دیگر یک آرزو نیست، یک واقعیت است.

جمعه ۹۸/۰۷/۱۲

زمان آماده سازی هر کتاب داستان و قصه

با توجه به اینکه انجمن تایپ، در بازتولید کتاب های اسکن و پی دی اف از فناوری OCR استفاده میکنه( و از روش های ویژه ای استفاده میکنه که دقت متن OCR رو به ۹۵% به بالا می رسونه) بازخوانی و ویرایش متن ها در آفیس خیلی سریع انجام میشه اما چیزی که بیش از همه وقت ما رو می گیره، ویرایش و بهینه سازی تصاویر کتاب هاست که با برنامه فتوشاپ انجام میشه و گاهی اوقات خیلی زمانبر میشه.

۹۵% دقت در OCR یعنی چقدر؟

شاید این سوال را از خودتان بپرسید و بگویید آن ۵% مابقی چیست؟ غلط های املایی است؟

نه، همه اش غلط املایی نیست. ۵% خطای موجود در OCR شامل تنظیم فونت، حذف کلمات زائد، پاراگراف بندی و درج علایم نوشتاری است.

تهیه متن و تصویر یک کتاب کودکانه ممکنه بین ۱ تا ۲ ساعت زمان ببره اما در بهترین حالت ممکن، توانستیم در بعضی روزها ۷ تا ۸ کتاب قصه و داستان را در سایت قرار دهیم.

آپلود کتاب ها در سایت هم فرایند خاصی داره و ممکنه برای هر کتاب، ۱۰ تا ۱۵ دقیقه طول بکشه. چون آپلود یک کتاب شامل: نوشتن عنوان، چینش تصاویر، نوشتن Alt تصاویر، تنظیم فونت متن، چیدمان متن، برچسب گذاری، لینک سازی، چکیده متن و تصویر شاخص میشه.

بطوری کلی همیشه با چند نرم افزار سروکار داریم:

آکروبات ریدر ۹
مایکروسافت آفیس ۲۰۰۷
فتوشاپ CS4 نسخه ۱۱ خاورمیانه (قدیمی و کم حجم اما بسیار روان و کاربردی)
و نرم افزار ساده و بسیار کاربردی Paint که گاهی اوقات ازش استفاده می کنیم. بعلاوه چند نرم افزار کمکی دیگر.

از فتوشاپ و پینت برای افزایش کیفیت متن و برش و بهینه سازی تصاویر استفاده می کنیم. در واقع اگر فتوشاپ نبود، ایده بازآفرینی قصه ها و داستان های قدیمی هیچوقت عملی نمی شد.

هر کتاب، یک چالش

بازتولید هر کتابی راهکار ویژه ای می طلبد. یعنی همه کتاب ها با یک روش یکسان تولید نمی شود بلکه در مورد کتاب های مختلف، از روش های متفاوتی استفاده می شود.

گاهی اوقات کیفیت متن یک کتاب بسیار پایین است. در این موارد باید راهکاری اندیشیده شود تا متن کتاب تا حد ممکن تقویت شود. لذا ابزارهای بازتولید متن تغییر می کند. مثلاً برای تولید یک کتاب، فتوشاپ ابزار اصلی است اما در یک کتاب دیگر، فتوشاپ یک نرم افزار کمکی است.

بعضی کتاب ها واترمارک دارند. یعنی یک نفر آمده و نشانی سایت یا لوگوی خود را در همه صفحات پی دی اف قرار داده است. وجود واترمارک باعث ایجاد غلط های املایی بی شمار در متن می شود لذا باید اول آن را پاک کنیم.

بعضی کتاب ها هم بدون هیچ دلیل خاصی رمزگذاری شده اند. وقتی یک کتاب اسکن می شود، در عمل آن را از دسترس کاربران خارج کرده ایم. چون تبدیل به عکس می شود و صرفاً حالت نمایشی دارد. اما برای تبدیل آن به متن، مجبوریم ابتدا رمز را هم برداریم.

بعضی کتاب ها هم کلاً ریسک است و تنها انگیزه ای که باعث می شود متن آن را بازتولید کنیم، ارزش آن کتاب است. بنابراین اگر فکر کنیم فعلاً وقت گیر است، آن را برای مراحل بعدی می گذاریم. تا حالا چنین مواردی در حد ۱ یا ۲ مورد داشته ایم.

افزودن بخش داستان های صوتی به سایت

امروز یک هاست دانلود سفارش دادم چون این ایده به ذهنم رسید که بخشی هم برای ارائه «داستان های صوتی» در نظر بگیریم. امیدوارم این بخش هم به زودی راه اندازی بشه تا تنوع بیشتر در محتوای سایت شاهد باشیم.

پنجشنبه ۹۸/۰۷/۱۱

با سلام

ارتقای سرعت سایت

دیروز و دیشب سایت دچار اختلالاتی بود چون در حال تنظیم اتصال سایت با شبکه توزیع محتوا (CDN) بودم. به علت اینکه سرعت سایت پایین بود و فعلاً امکان ارتقای هاست وجود ندارد(حداقل ماهی ۶۰ هزار تومان هزینه دارد) تصمیم گرفتم سایت را به شبکه CDN وصل کنم. ابتدا شبکه محتوای کلودفِلِر (Cloudflare) را اجرا کردم اما هیچ تاثیری در افزایش سرعت سایت نداشت. خوشبختانه بعد متوجه شدم که یک CDN ایرانی به نام «ابر آروان» (Arvancloud) وجود دارد که با هزینه کم، شبکه توزیع محتوا را فعال می کند.

تا امروز مشغول تنظیم سایت و CDN بودم و خوشبختانه با تست های که گرفتم متوجه شدم که سرعت سایت در شرایط ترافیک مختلف، بین ۴۰ تا ۵۰ % افزایش پیدا کرده است.

بنابراین فعلاً نیازی به ارتقای هاست نیست و افزایش حجم آپلود سایت کافی است.

پنج شنبه ۱۳۹۸/۰۷/۰۴

امروز روی دو کتاب نسبتاً طولانی کار کردم:

«قصه پسر بندانگشتی – جلد ۲۹ کتابهای طلایی» و «گزیده‌ای از ادبیات جهان برای کودکان و نوجوانان – جلد ۲»

آماده سازی کتاب های طلایی کار لذت بخشی است چون هم تنوع بیشتری دارد و هم ترجمه روان و قابل قبولی دارد اما بعضی کتابها واقعاً «ناامیدکننده» هستند و بازآفرینی آنها لطف چندانی ندارد. از جمله این کتابها «جلد ۲ و جلد ۱ گزیده ای از ادبیات جهان برای کودکان و نوجوانان» بود. این دو جلد کتاب واقعاً سوهان روح من بود.

متاسفانه یا خوشبختانه، چون خودم کارشناسی ادبیات انگلیسی دارم، در خواندن کتابهای ترجمه محدودیت دارم چون گاهی ترجمه هایی که به فارسی شده چنان مغلوط، ناشیانه و ماشینی است که انسان با خودش کلنجار می رود «گیرم زبان انگلیسی را خوب نفهمیدی، چرا جمله ات را به فارسی چنین نوشتی؟»

مثلاً در جلد دوم کتاب فوق در بخش داستان «موبی دیک» با این جمله روبرو می شویم:

کاپیتان آهاب خیلی از شنیدن خبرهائی درباره موبی دیک که ساعتهای طولانی را برای مشاهده آن بر روی عرشه نشسته و با دوربین به اطراف می‌نگریست به هیجان آمد.

واقعاً در کجای ایران ممکن است یک فارسی زبان چنین طرز بیانی داشته باشد؟ اگر یک دانش آموز می خواست این جمله را به زبان فارسی رایج بیان کند احتمالاً می گفت:

«ناخدا آهاب که ساعت های طولانی روی عرشه می نشست و با دوربین به اطراف نگاه می کرد، از شنیدن خبرهایی در مورد موبی دیک به هیجان آمد …»

به هر صورت، بازآفرینی کتاب های قدیمی مشکلات خاص خود را دارد. این دوجلد کتاب هم در کل، کتابهای خوبی است اما نگارش آنها از همان ابتدا کهنه و قدیمی بوده و نیاز به «بازنویسی» دارد. شما هم اگر به این دو کتاب علاقه دارید می توانید دست به قلم شوید و متن زیباتری برای آنها «بازنویسی» کنید.

دوشنبه ۱۳۹۸/۰۶/۲۵

در یکی دو روز گذشته، به علت مشغله زیاد، تعداد آپلود نوشته های سایت کاهش پیدا کرد. مثلاً امروز فقط داستان «پری کوچولوی دریایی» در سایت قرار گرفت.

همانطور که گفتم مشغله زیاد باعث این کاهش فعالیت شد که البته چاره ای هم جز این نبود چون همزمان با سایت، روی کانال ایپابفا در آپارات هم کار می کنم و به علت افت شدید بازدید کانال، در حال انجام راهکارهایی برای جبران مافات بودم.

مدیریت محتوای سایت ایپابفا کار دشواری است. از یک طرف، متن کتابها باید عیناً مطابق با متن اصلی تایپ شود و بعد تصاویر کتابها هم با حداکثر کیفیت ممکن ویرایش شود. گاهی اوقات هم موفقیت کامل به دست نمی آید. مثلاً تصاویر همین کتاب «پری کوچولوی دریایی» چندان باب میلم نبود و هرچه این در و آن در زدم، بلکه تصاویر اصلی آن را در اینترنت پیدا کنم نشد که نشد. فقط چند تصویر ناقص در سایت عکس پینترست پیدا کردم.

این روزها مشغله مالی آزارم می دهد. شاید چندان مرسوم نباشد که مدیر سایت در فضای سایت راجع به «مسائل و مشکلات شخصی » خودش بنویسد اما این صفحه چندان «رسمی» نیست و با توجه به آمار، چندان بازدیدی هم ندارد.

البته حال و روز خیلی دیگر از مدیران سایت ها و وبلاگ ها هم بهتر از من نیست. کاش از حداقل پشتوانه مالی برخوردار بودم تا تمام وقتم را صرف این سایت کنم. در این سایت من واقعاً خسته نمی شوم بلکه برعکس، کار در این سایت خستگی و استرس مرا کاهش می دهد.

«پول» همیشه مشکل بزرگی برای من بوده و هیچگاه به یاد ندارم که پول زیادی در اختیارم بوده باشد! حتی توان مالی برای ارتقای فضای هاست این سایت را ندارم. برای همین است که در فضا خیلی صرفه جویی می کنم و حجم تصاویر را کم می کنم و فایل اضافه در سایت قرار نمی دهم. دلم می خواهد سایت را به یک هاست پربازدید و پرسرعت منتقل کنم اما مشکل مالی اجازه این را هم نمی دهد.

دوست داشتم فایل پی دی اف هر یک از داستان ها را هم برای دانلود قرار دهم تا کاربران به تفاوت ها و حجم کار هر نوشته پی ببرند اما مشکل حجم اینترنت و محدودیت فضای میزبانی سایت مانع از این کار می شود. حجم پی دی اف هایی که تاحالا کار شده، حدود ۸۵۰ مگابایت شده و حدود ۳ گیگابایت مطلب هنوز در انتظار بررسی و تایپ است.

خلاصه اینکه امروز اگر ۳ میلیون تومان پول داشتم، خودم را آدم خوشبختی حساب می کردم. خوش به حال آدم هایی که ۳ میلیون برایشان عین ۳ ریال است.

امیدوارم با این همه فکر و مشغله بتوانم سایت را سریع تر جلو ببرم و نظم بیشتری در بروزرسانی نوشته های آن داشته باشم.

جداکننده تصاویر پست های سایت ایپابفا2

جمعه ۱۳۹۸/۰۶/۱۵

منظور از گروه های سنی کودک و نوجوانان چیست؟

گروه الف: سالهای قبل از دبستان

گروه ب : سالهای آغاز دبستان ( کلاسهای اول و دوم )

گروه ج: سالهای پایان دبستان (کلاسهای چهارم و پنجم)

گروه د: دوره راهنمایی

گروه ﻫ: سالهای دبیرستان

جداکننده تصاویر پست های سایت ایپابفا2

چهارشنبه ۱۳۹۸/۰۶/۰۶

تغییرات سایت

امروز یک دستی به سر و روی سایت کشیدم.

فهرست اصلی سایت را بروزرسانی کردم و مطالبی را که متعلق به سایت نبود و از منابع دیگر وام گرفته بودیم از فهرست اصلی خارج کردم. طوری که فهرست سایت به «رمان، داستان کوتاه، کتاب کودک و کتاب نوجوان» محدود شد.

دسته «کتاب کودک و نوجوان » را حذف کردم و کتابها را به دو دسته «کتاب کودک» و «کتاب نوجوان» تقسیم کردم.

اولین سربرگ سایت

با مهارت ناچیزی که در فتوشاپ دارم یک سربرگ آزمایشی برای سایت طراحی کردم که تصاویرش، شخصیت های داستانی کتابهای سایت است. یعنی:

عمونوروز، فلفلی، جوجه اردک بامزه، ایکیو سان و فرشته مهربان داستان پینوکیو.

جداکننده تصاویر پست های سایت ایپابفا2

دوشنبه ۱۳۹۸/۰۶/۰۴

بهره گیری از فناوری OCR در تولید نسخه دیجیتال کتابهای اسکن قدیمی

امروزه کتابهای بسیاری در اینترنت وجود دارد که نسخه چاپی آنها گاهی اوقات مربوط به دهها سال پیش است و تنها نسخه الکترونیکی موجود ازآنها، نسخه اسکن شده آنها است که معمولاً با فرمت عکس یا pdf ذخیره سازی شده است. این نسخه های اسکن، کپی برابر اصل نسخه های چاپی است که از حیث رعایت و نگهداری متن چاپی بسیار کارگشا است اما از انعطاف چندانی برخوردار نیست.

امروزه کاربران محتوایی را بیشتر می پسندند که قابل ویرایش باشد و قابلیت تبدیل به فرمت های دیگر و استفاده در صفحات وب و نرم افزارها را داشته باشد. لذا در مواجهه با فایل های اسکن شده، با محدودیت های بسیاری روبرو می شویم.

تنها راهکار سنتی تبدیل فایل های اسکن به متن قابل ویرایش ، تایپ دستی این قبیل متن هاست. یعنی یک کاربر باید جلوی رایانه بشیند، متن را بخواند و در نرم افزار ویرایش متنی همچون مایکروسافت آفیس ورد تایپ کند.

مشخص است که این راهکار تا چه اندازه دشوار و «هزینه بر» است.امروز که نرخ تایپ یک صفحه استاندارد (حدود ۲۵۰ کلمه در صفحه) را در سایت های تایپ بررسی می کردم نرخ ها بین ۱۰۰۰ تا ۱۱۹۲ تومان نوسان داشت.شما فکر کنید متن داستان « شاهزاده و گدا » ۹۴۰۰ کلمه ، داستان «آرتورشاه و دلاوران میزگرد» ۸۱۰۰ کلمه، داستان کوتاه «دندیل » ۷۱۰۰ کلمه و «قصه های روسی» ۱۳۴۰۰ کلمه است.این یعنی تایپ همین ۴ نوشته کوتاه با ۳۸۰۰۰ کلمه در سایت حداقل چیزی بین ۱۵۰ تا ۱۸۰ هزار تومان هزینه در بردارد . البته به غیر از برش تصاویر و کارهای فتوشاپ و غیره.

واضح است که پرداخت چنین هزینه هایی برای سایت های غیرانتفاعی که محتوای رایگان ارائه می کنند چقدر سنگین است و اگر یاری دوستان نبود مسلماً قادر به ارائه این محتوا آن هم به صورت رایگان نبودیم.

اینجاست که از خودمان می پرسیم آیا با وجود پیشرفت های علمی روشی وجود دارد که بشود فایل اسکن شده را توسط یک نرم افزار به متن قابل ویرایش تبدیل کرد ؟

خوشبختانه امکان چنین کاری وجود دارد ، البته به شرطها و شروطها . این یعنی که اگر این رویای شیرین یک لحظه در ذهنتان نقش بست که با اشاره یک کلیک، فایل پی دی اف اسکن شده به ورد تبدیل می شود ، یک کم بیش از حد خوشبین شدید.

نکته اول اینکه: اگر بهترین نرم افزار و سخت افزار OCR دنیا را هم پیدا کنید، آخرش باید دوباره بنشینید و متن نهایی را با فایل اصلی مقایسه کنید و بصورت دستی اصلاح و غلط گیری کنید.

ثانیاً، همه متن های اسکن شده آنقدر باکیفیت نیستند که خروجی ۱۰۰% دقیقی داشته باشند.

و سوم اینکه: کلاً نرم افزارهای OCR با پی دی اف فارسی میانه خوبی ندارند. حتی گوگل درایو هم پی دی اف فارسی را تبدیل نمی کند. درواقع باید پی دی اف را به عکس تبدیل کنید و عکس را OCR کنید، نه پی دی اف را .

البته در اینجا ما داریم راجع به پی دی اف تصاویر اسکن شده صحبت می کنیم وگرنه سایر پی دی اف ها حسابشان جداست. خیلی از پی دی اف ها اسکن نیستند و صرفاً خروجی پی دی اف نرم افزار ورد و امثال آن هستند. این قبیل پی دی اف ها که در واقع متن تایپ شده هستند با هزینه جزئی قابل تبدیل به ورد هستند. مثلاً می توانید به سایت pdftodoc.ir مراجعه کنید و یک نسخه نرم افزار تبدیل پی دی اف به ورد به قیمت ناچیز بخرید و کارتان را شروع کنید. نرم افزار این سایت واقعاً عالی است اما عملکرد آن وابسته به قدرت سخت افزاری رایانه شماست. انتظار هم نداشته باشید OCR داشته باشد، چون ندارد. یک OCR معمولی از چند صدهزار تا چندمیلیون تومان قیمت دارد.

شخصاً در زمینه OCR تجربه های خوبی دارم و عملاً با فناوری آن کار کرده ام. اما OCR هم یک ابزار کمکی است. اصلی ترین ابزاری که کار را تمام می کند چشمان و دستان مبارک خود شماست.

یک بار یک متن را در یک ساعت OCR کردم اما بازخوانی و ویرایش نهایی آن ۵ ساعت طول کشید. درکل، فناوری کمکی واقعاً خوبی است.

گاهی اوقات فکر می کنم یک بخش OCR هم در سایت بگذاریم و سفارش قبول کنیم اما وقتی یادم می آید که کاربران چه سوء تفاهم ها و خوش خیالی هایی در مورد OCR دارند پشیمان می شوم. چون کاربران ممکن است توقع داشته باشند یک متن ۴۰۰ صفحه ای را دو ساعت دیگر ویرایش شده خدمتشان ارائه کنیم. البته می توانیم ارائه کنیم اما نه ویرایش شده. بعد باید خودشان مرحمت کنند و چند روز وقت بگذارند و متن ورد را با فایل اصلی مقایسه کنند. دست کم این حسن را دارد که اینطوری ، متن موردنظرشان چند روزه آماده می شود.

بحث OCR خیلی طولانی است. صرفاً خواستم اشاره ای به این موضوع و کم و کاستی ها و نقاط قوت آن داشته باشم.

آنچه از OCR مهمتر است این است که می خواهید با خروجی فایل نهایی چکار کنید؟ – قرار است این خروجی به چه چیزی تبدیل شود؟ – و آیا صرفه اقتصادی یا وجاهت قانونی دارد؟

جداکننده تصاویر پست های سایت ایپابفا2

به نام خدا

دوشنبه: ۲۸ مرداد ۱۳۹۸

یک کشف ظاهراً بزرگ و ساده

مدتی بود که متحیر بودم چرا نوشته های سایت برجسته (Bold) است. هرچه با فونت های قالب ور می رفتم تاثیری نداشت. فکرمی کردم شاید مشکل از قالب سایت است و کدهای css سایت نیاز به تغییر دارد تا اینکه امروز متوجه مشکل شدم.

از آنجا که نوشته های سایت را ابتدا در نرم افزار word تایپ می کنم، ناخواسته گزینه برجسته نمایی در ورد فعال بوده و وقتی که نوشته را به ویرایشگر سایت منتقل می کردم می بایست تیک B آن را بردارم . اما چون فکر می کردم که این مشکل از قالب سایت است به این موضوع دقت نمی کردم و امروز متوجه این نکته بدیهی و فوق العاده ساده شدم .

گاهی اوقات مشکلات ظاهراً بزرگ، راه حل های ساده ای دارد اما چون ما به دنبال راه حل های بزرگ و پیچیده برای مشکلات خود هستیم، متوجه راه حل های کوچک نمی شویم.

به نام خدا

چهارشنبه ۲۳ مرداد ۱۳۹۸

شازده کوچولو

امروز تمام وقتم را صرف تایپ، ویرایش و تنظیم تصاویر رمان کوتاه «شازده کوچولو» نوشته آنتوان دو سنت اگزوپری کردم. خیلی خسته شدم. چون هم کار اصلاح و ویرایش داشت و هم کار برش تصاویر و فتوشاپ و آخرش هم دوباره تنظیم تصاویر در ویرایشگر سایت.

عجله داشتم تا آن را امروز منتشر کنم. برای همین شاید هنوز پاره ای غلط های املایی در آن وجود داشته باشد. عکس های بهتری برایش گیر نیاوردم. حتی به یک ترجمه انگلیسی هم مراجعه کردم و از تصاویر آن که کیفیت بهتری داشت استفاده کردم.

به نام حضرت حق

دوشنبه ۲۱ مرداد ۱۳۹۸

امروز عید قربان بود. دعوت بودیم روستا. برای همین ۴ تا مطلب بیشتر نتوانستم بگذارم: سه کتاب کودک (مارتین در سفر ، مارتین و ژان کوچولو ، روباه نخاله )و یک قصه قدیمی (میهمان های ناخوانده) .

بعضی وقت ها ترجیح می دهم روی کتاب های کوتاه تر کار کنم. شب که از روستا برگشتم، روی یک کتاب قصه قدیمی کار کردم اما ترجیح دادم به جای اینکه چند قصه را در یک پست قرار دهم، قصه ها را دانه دانه در نوشته های جدید منتشر کنم و اشاره ای هم به منبع قصه ها کنم. اینطوری، حداقل می توانستم امشب یک قصه را منتشر کنم.

رتبه سایت

دیروز اتفاق جالبی برای سایتم افتاد. رتبه سایتم یک دفعه ۲/۳۰۰/۰۰۰ تا رشد کرد. این نشان می دهد که سایتم در حال بازدید است. هر روز نتایج گوگل را بررسی می کنم و تصاویر کتابها را تماشا می کنم. دارم روی سئوی عکس ها هم کار می کنم.

دیروز با گوشی بچه ها وارد سایتم شدم تا ببینم قالب موبایل سایت چطور است.(گوشی خودم تعریفی ندارد. مدل ۲۰۱۳ است.) تماشای قالب واکنشگرای سایت در گوشی برایم خیلی جالب بود.آنقدر که دلم می خواست بنشینم و همه کتابهایش را بخوانم.

کانال آپاراتم

ده روزی است که درست و حسابی کانال آپاراتم را بروزرسانی نکرده ام. مشکل آپلود دارد. به جایش دارم روی سایتم کار می کنم .یعنی همین سایت. حداقل اینجا را بگیرم تا ببینم آپارات چه می شود.

بعضی وقت ها چندتا ویدیو آپلود می کنم اما خسته می شوم. مگر آدم چقدر می تواند از این ور و آن ور ویدیو گیر بیاورد. با چندتا ویدیو هم به جایی نمی رسد. خدا کند مشکل آپلود هرچه سریعتر حل شود.

به نام خدا

یک شنبه ۲۰ مرداد ۱۳۹۸

یادداشت هایی در مورد داستان کوتاه دندیل نوشته غلامحسین ساعدی

امروز داستان کوتاه «دندیل» نوشته غلامحسین ساعدی را تایپ و منتشر کردم. مدت ها بود که در فکر تایپ این داستان بودم چون به نظر من داستان قابل تحسینی است.

اگرچه زبان داستان، عامیانه و اکنده از عبارات و کلمات غیراخلاقی است اما این داستان حاوی دیدگاه های پنهانی است که بیان صریح آنها در زمان چاپ کتاب بسیار خطرناک و جسارت آمیز بوده است.

این داستان کوتاه را از زوایای بسیاری می توان مورد بررسی و نقد قرار داد.

از دیدگاه اجتماعی و اقتصادی، این داستان بیانگر فقر مادی و اقتصادی مردمی است که برای امرار معاش تن به تن فروشی و فساد می دهند. فقری که زور و ارعاب رژیم پهلوی هم بر آن افزوده و به جای اینکه ثروت خود را در اختیار مردم قرار دهد، آمریکا را بر مال و ناموس مردم مسلط کرده است.

از زوایه سیاسی ، این داستان به شدت ضدآمریکایی و ضدپهلوی است .در این داستان، استوار امریکایی نماینده استعمار آمریکایی است که با ورود به هر سرزمینی ، تمام منابع آن سرزمین حتی نوامیس آن را متعلق به خود می داند.

رفتار استوار آمریکایی از لحظه ای که مست وارد دندیل می شود شروع ، و با ادرار کردن او در دندیل به پایان می رسد . او نماینده دولتی است که به قول پاسبان اسدالله بسیار متمدن و ثروتمند است.دولتی که مثل ریگ پول خرج می کند و در مقابل، ملت ایران را مشتی گدا گشنه وحشی به حساب می آورد. اما در واقع بسیار لاابالی و قلدرمآب است.

در این داستان، پاسبان اسدالله تمثالی از رژیم پهلوی است که سنگ آمریکا را به سینه می زند و مدام از تمدن امریکایی و ثروت امریکا دم می زند. پاسبان اسدالله حاضر است برای حمایت از استوار آمریکایی حتی به روی مردم خود اسلحه بکشد و در اوج عقب ماندگی کشور ادعا می کند که مملکت بی سرو صاحب نیست که مردم هرکاری بخواهند بکنند.

در داستان دندیل، ساعدی، بقای آمریکا در ایران را ناشی از حمایت رژیم پهلوی از آن می داند. آنجا که پاسبان اسدالله می گوید: « تامن هستم هیچ … نمیتونین بخورین، خیال کردین، مملکت حساب و کتاب نداره.». و در عین حال، تنها راه خلاصی از دست آمریکا را سرنگونی حکومت پهلوی می داند و دیدگاه خود را بر زبان شخصیت کارگر کوتاه قدی جاری می کند و می گوید:

«راس میگه تا اینا هسن، هیچ کارشون نمیتونیم بکنیم.»

دندیل، نخستین بار در سال ۱۳۴۵ و بار دیگر در سال ۱۳۵۲ یعنی ۵ سال پیش از انقلاب چاپ شده است. بنابراین انچه در این کتاب می آید روایتی بی غل و غش از استبداد دستگاه حاکم و استعمار امریکاست.

خواندن این داستان را به همه نسل نوین ایران توصیه می کنم ، نسلی که بعضاً همه چیز را استحاله واقعیت و نمایش از زوایه دید نظام کنونی می داند و شاید باور ندارد که آنچه از ظلم و بیدادگری آمریکا و رژیم پهلوی می گویند عین واقعیت است. اما خواندن این داستان نظر شما را عوض می کند.

دندیل اعتراض تلخ غلامحسین ساعدی به وضع اجتماعی و سیاسی روزگار پهلوی و ذلتی است که از سوی آمریکا بر مردم ایران تحمیل شده است. در این داستان ساعدی بر این باور است که آمریکا برخلاف ظاهر متمدن و شیکی که دارد چندان هم بویی از تمدن نبرده و تنها چیزی که او را بر جهان مسلط ساخته زورگویی و قلدرمآبی اوست. آنجا که پاسبان اسدالله در پایان داستان پس از آن همه تعریف و تمجید از تمدن آمریکا به یکباره تغییر موضع می دهد و با اشاره به رفتار قلدرمآبانه آمریکا اظهار می کند:

«نه پنجک، نمیشه چیزی بهش گفت، نمیشه ازش پول خواست. این مثل من و تو نیس، این امریکاییه. اگه بدش بیاد، اگه دلخور بشه، همه دندیلو به هم میریزه، همه رو به خاک و خون میکشه.»

چه خوب است منتقدان توجه بیشتری به این داستان داشته باشند و زوایای پنهان این داستان را بیشتر باز کنند و دیگر دیدگاه های ساعدی را که در این داستان پنهان شده آشکار سازند.

مدیر سایت

به نام خدا

شنبه ۱۳۹۸/۰۵/۱۹

سلام دوستان

این برگه را در سایتم ایجاد کردم تا بتوانم نظرات شخصی خودم را بیان کنم.

به جای این برگه می توانستم یک افزونه ساخت وبلاگ نصب کنم .اما از من به شما نصیحت:

«تا می توانید از افزونه ها فرار کنید. چون بالاخره یک روزی افزونه ها قاطی می کنند و سایت شما را به فنا می دهند.»

امروز چه کارهایی کردم؟!

از صبح که به سر کار رفته بودم مشغول اصلاح و ویرایش «مجموعه قصه های روسی» بودم. متن کتاب، تایپ شده بود اما از صبح که مشغول ویرایش شدم آنقدر سرم به کار گرم بود که اذان ظهر متوجه شدم ظهر شده است. کارم تمام شده بود هرچند مطمئن نیستم که عاری از غلط های املایی باشد.

راستش از شما چه پنهان ، متن اصلی کتاب که یک پی دی اف عتیقه به نام «مجموعه ای از قصه های روسی» بود خیلی غلط انداز بود . متن کتاب خیلی عجولانه چاپ شده بود و پر از غلط های املایی و مشکلات نگارشی بود. به هر صورت، ویرایش اول را اماده کردم و الان روی سایت است. فکر نکنم توی دنیا کسی غیر از من حاضر بود این کتاب را تایپ و ویرایش کند . اما قصه هایش بد نبود.از جمله قصه « ایوان تهی دست و ایوان توانگر » که واقعاً ازش خوشم آمد . مخصوصاً قسمت «کیسه چماق ها » که خیلی ازش خندیدم.

از صفر تا صد این کتاب، حدود ۷ ساعت طول کشید . یعنی ۷ ساعت طول کشید تا تایپ و منتشر شد . زمان زیادی است! چه خبر است! به همت دوستان، یک ساعته متن تایپ اش آماده شد اما ۶ ساعت طول کشید تا آن را بازخوانی و ویرایش کنم . تا وقتی متن را با پی دی اف اصلی مقابله نکنم،روی سایت قرار نمی دهم.

عصر هم یکساعتی چرت زدم و دست به کار شدم . از بین کتاب ها «راپونزل» را انتخاب کردم . اولش فکر می کردم چون متنش کم است سه سوته تمام می شود . اما اینطور نبود.

کتاب های کودک اگرچه کوتاه است اما چون همراه با تصاویر است ، باید بعد از اینکه سرت را از توی آفیس بیرون آوردی، سرت را ببری توی فتوشاپ و پینت و تا بیایی عکس ها را آماده کنی، می بینی ساعت ها گذشته!

بعضی وقت ها روی عکس ها کار می کنم. یعنی کار فقط به یک برش و ذخیره ختم نمی شود. بلکه نوبت به ویرایش و اصلاح عکس ها هم می رسد و بعضی عکس ها انقدر گیر می دهند که خودم هم می فهمم دارم خیلی وقت صرفش می کنم. از جمله همین راپونزل . فکر کنم صفر تا صدش ۲ ساعت طول کشید . بیش از انتظارم وقت برد. بیشتر مشغول تصاویرش بودم تا متن.

هنوز کسی برای ویرایش متن ها داوطلب نشده . اگر کسی داوطلب شود، کارم خیلی راحت می شود.

خودم هم می دانم که در این دوره زمانه کسی حال و حوصله کار مفتی را ندارد و حتماً باید مایه تیله وسط باشد . اما من خودم هم داوطلبانه دارم کار می کنم و عشق و علاقه به کتاب و مطالعه است که مرا به این کار تشویق می کند .



پاسخی بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *