انجمن‌های فارسی اوبونتو

جامعه کاربران => معرفی نرم‌افزار => نویسنده: سید وحید رضا برهانی در 28 بهمن 1393، 12:23 ب‌ظ

عنوان: تشخیص الگو های تکرار شونده در یک فایل متنی
ارسال شده توسط: سید وحید رضا برهانی در 28 بهمن 1393، 12:23 ب‌ظ
من دنبال یک نرم افزاری می گردم که یک فایل متنی رو بهش بدیم و اون توی فایل الگو ها را پیدا کنه مثلا بگه رشته ی abcd هر ۲۳ بایت یک بار تکرار می شه یا یک چیزی توی این مایه ها. زیاد کار پیچیده ای نمی خوام بکنه
البته اگر شباهت رشته ها رو هم بتونه حدس بزنه که عالی می شه یک چیزی مثل  نرم افزارهای بیوانفورماتیکی که الگوهای ژنی رو توی دیتابیس ها سرچ می کنند.
عنوان: پاسخ : تشخیص الگو در یک فایل متنی
ارسال شده توسط: alend در 28 بهمن 1393، 12:32 ب‌ظ
سلام

ترکیب grep و regex برای کارهای ساده عالی است وسریع.

blast , fasta هم برناهمه خاص خود را دارند.

اگر ترکیب خاصی را می خواهی بگو تا جایی بتونم کمک می کنم.

اگر دنبال ژن در توالی ژنوم می گردی قبلا از زنجیره های مارکو استفاده می کردند.
عنوان: پاسخ : تشخیص الگو در یک فایل متنی
ارسال شده توسط: سید وحید رضا برهانی در 28 بهمن 1393، 12:54 ب‌ظ
سلام عزیز
ممنون ولی من ابزارهای بیوانفورماتیکی رو فقط به عنوان مثال گقتم که یعنی همچین چیزی هست.
من الگو ها رو ندارم (یعنی نمی خوام یک الگوی خاص رو جست وجو کنم) و می خوام که نرم افزار بهم بگه که چه الگوی تکرار شونده ای توی فایل هست. حالا با grep می شه اینکار رو کرد؟
عنوان: پاسخ : تشخیص الگو های تکرار شونده در یک فایل متنی
ارسال شده توسط: alend در 28 بهمن 1393، 01:17 ب‌ظ
من نرم افزار خاصی نمی شناسم ولی به طور کلی از الگوریتم های یادگیری ماشین استفاده می کنند.
عنوان: پاسخ : تشخیص الگو های تکرار شونده در یک فایل متنی
ارسال شده توسط: alireza.crs در 30 بهمن 1393، 11:08 ق‌ظ
من دنبال یک نرم افزاری می گردم که یک فایل متنی رو بهش بدیم و اون توی فایل الگو ها را پیدا کنه مثلا بگه رشته ی abcd هر ۲۳ بایت یک بار تکرار می شه یا یک چیزی توی این مایه ها. زیاد کار پیچیده ای نمی خوام بکنه
البته اگر شباهت رشته ها رو هم بتونه حدس بزنه که عالی می شه یک چیزی مثل  نرم افزارهای بیوانفورماتیکی که الگوهای ژنی رو توی دیتابیس ها سرچ می کنند.
اگه میخوای این الگو ها در قالب regx باشه از یه متن بینهایت الگو  میشه دراورد
عنوان: پاسخ : تشخیص الگو های تکرار شونده در یک فایل متنی
ارسال شده توسط: alend در 30 بهمن 1393، 11:35 ق‌ظ
من دنبال یک نرم افزاری می گردم که یک فایل متنی رو بهش بدیم و اون توی فایل الگو ها را پیدا کنه مثلا بگه رشته ی abcd هر ۲۳ بایت یک بار تکرار می شه یا یک چیزی توی این مایه ها. زیاد کار پیچیده ای نمی خوام بکنه
البته اگر شباهت رشته ها رو هم بتونه حدس بزنه که عالی می شه یک چیزی مثل  نرم افزارهای بیوانفورماتیکی که الگوهای ژنی رو توی دیتابیس ها سرچ می کنند.
اگه میخوای این الگو ها در قالب regx باشه از یه متن بینهایت الگو  میشه دراورد

ولی باید تکراری باشند.
عنوان: پاسخ : تشخیص الگو های تکرار شونده در یک فایل متنی
ارسال شده توسط: سید وحید رضا برهانی در 30 بهمن 1393، 10:17 ب‌ظ
من یک چیزی پیدا کردم که نمی شه گفت همونی هست که می خواستم ولی لااقل یکخورده بهم کمک کرد یک قابلیت توی نرم افزار okteta بود به اسم statistics که از توی منوی tools پیدا می شه . این قابلیت می یاد فراوانی بایت ها رو حساب می کنه مثلا می گه مقدار ۱۲۸ دو هزار بار تکرار شده و ۱۰ درصد کل فایل هست. البته این چیزی رو ثابت نمی کنه ولی می شه حدس زد که اوناهایی که فراوانی شان مثل هم هست احتمالا با هم ارتباط دارند. درکل از هیچی بهتره!
okteta --> tools ---> statistics