انجمنهای فارسی اوبونتو
جامعه کاربران => معرفی نرمافزار => نویسنده: سید وحید رضا برهانی در 28 بهمن 1393، 12:23 بظ
-
من دنبال یک نرم افزاری می گردم که یک فایل متنی رو بهش بدیم و اون توی فایل الگو ها را پیدا کنه مثلا بگه رشته ی abcd هر ۲۳ بایت یک بار تکرار می شه یا یک چیزی توی این مایه ها. زیاد کار پیچیده ای نمی خوام بکنه
البته اگر شباهت رشته ها رو هم بتونه حدس بزنه که عالی می شه یک چیزی مثل نرم افزارهای بیوانفورماتیکی که الگوهای ژنی رو توی دیتابیس ها سرچ می کنند.
-
سلام
ترکیب grep و regex برای کارهای ساده عالی است وسریع.
blast , fasta هم برناهمه خاص خود را دارند.
اگر ترکیب خاصی را می خواهی بگو تا جایی بتونم کمک می کنم.
اگر دنبال ژن در توالی ژنوم می گردی قبلا از زنجیره های مارکو استفاده می کردند.
-
سلام عزیز
ممنون ولی من ابزارهای بیوانفورماتیکی رو فقط به عنوان مثال گقتم که یعنی همچین چیزی هست.
من الگو ها رو ندارم (یعنی نمی خوام یک الگوی خاص رو جست وجو کنم) و می خوام که نرم افزار بهم بگه که چه الگوی تکرار شونده ای توی فایل هست. حالا با grep می شه اینکار رو کرد؟
-
من نرم افزار خاصی نمی شناسم ولی به طور کلی از الگوریتم های یادگیری ماشین استفاده می کنند.
-
من دنبال یک نرم افزاری می گردم که یک فایل متنی رو بهش بدیم و اون توی فایل الگو ها را پیدا کنه مثلا بگه رشته ی abcd هر ۲۳ بایت یک بار تکرار می شه یا یک چیزی توی این مایه ها. زیاد کار پیچیده ای نمی خوام بکنه
البته اگر شباهت رشته ها رو هم بتونه حدس بزنه که عالی می شه یک چیزی مثل نرم افزارهای بیوانفورماتیکی که الگوهای ژنی رو توی دیتابیس ها سرچ می کنند.
اگه میخوای این الگو ها در قالب regx باشه از یه متن بینهایت الگو میشه دراورد
-
من دنبال یک نرم افزاری می گردم که یک فایل متنی رو بهش بدیم و اون توی فایل الگو ها را پیدا کنه مثلا بگه رشته ی abcd هر ۲۳ بایت یک بار تکرار می شه یا یک چیزی توی این مایه ها. زیاد کار پیچیده ای نمی خوام بکنه
البته اگر شباهت رشته ها رو هم بتونه حدس بزنه که عالی می شه یک چیزی مثل نرم افزارهای بیوانفورماتیکی که الگوهای ژنی رو توی دیتابیس ها سرچ می کنند.
اگه میخوای این الگو ها در قالب regx باشه از یه متن بینهایت الگو میشه دراورد
ولی باید تکراری باشند.
-
من یک چیزی پیدا کردم که نمی شه گفت همونی هست که می خواستم ولی لااقل یکخورده بهم کمک کرد یک قابلیت توی نرم افزار okteta بود به اسم statistics که از توی منوی tools پیدا می شه . این قابلیت می یاد فراوانی بایت ها رو حساب می کنه مثلا می گه مقدار ۱۲۸ دو هزار بار تکرار شده و ۱۰ درصد کل فایل هست. البته این چیزی رو ثابت نمی کنه ولی می شه حدس زد که اوناهایی که فراوانی شان مثل هم هست احتمالا با هم ارتباط دارند. درکل از هیچی بهتره!
okteta --> tools ---> statistics