آخرین پاسخِ برنامهنویس این لغتنامه:
وردنت رو بررسی کردم. تا جایی که متوجه شدم، این پایگاه داده، بیشتر برای یافتن رابطۀ معنایی کلمات و پردازش زبان طبیعی استفاده میشه. از این جهت، امکان تبدیل پایگاۀ داده متنی واژهدان به این قالب وجود نداره؛ چون برای این کار لازمه چند صد هزار کلمه در دستهبندی مناسب به این پایگاه داده معرفی بشه و اساساً نیازی به این قالب نیست. من نمیدونم چرا آقا دانیال، برای ساخت نسخۀ لینوکسی برنامه همچین قالبی رو درخواست کردند!
با همین فرمت متنی هم میتوان از دیتابیس برنامه استفاده کرد. نیازی به جداسازی کلمات مترادف و متضاد نیست؛ همه کلمات با یک الگو و حائل مناسب (علامت ،) از یکدیگر جدا شدهاند. من قبلاً با لینوکس کار کردم، بسیاری از فرهنگها بر مبنای وردنت نیستند. اساساً مشکل اصلی، پیادهسازی برنامه در لینوکس است، باقی کار پارز کردن یک دیتابیس بسیار سادۀ متنی است. دیتابیس، دیتابیس است، متنباز و غیرمتنباز ندارد. یک نفر آستین بالا بزند، من دیتابیس را به هر فرمتی (Json، SQL, No SQL و ...) تحویل میدهم. مهم الگو داشتن دادهها است که دیتابیس متنی واژهدان دارد.
پینوشت:
فرمت استاندارد وردنت نیازمند تفکیک صفات، افعال و اسامی و ... است و متأسفانه چون فرهنگ واژهدان به صورت متنی از یک فایل ورد و فاقد چنین تفکیکی استخراج شده، به سختی میشه به فرمت وردنت تبدیل کرد. حتی به نظرم اگه تبدیل هم بشه، تناسبی با ماهیت Artha و نرمافزارهای مبتنی بر وردنت نداره. دلیلش اینه که واژهدان صرفاً در میان چند هزار سطر جستجو میکنه و سطرهایی که شامل کلمه هستند رو نمایش میده. همین الان هم کاربران لینوکس با کپی دیتابیس متنی واژهدان به یک فایل متنی در لینوکس و جستجو در اون فایل میتونن کار خودشون رو راه بندازن. تنها مشکلش اینه که سهولت و کاربرپسندی یک واسط کاربری رو از دست میدن. ساخت یک واسط کاربری برای جستجو داخل یک فایل متنی، اصلاً کار سختی نیست. کافیه یک توسعهدهندۀ لینوکسی یکی دو هفته وقت بزاره.