از پارسکدرز بیشترین بهره را ببرید و رویای کاری خود را زندگی کنید.
چهار سال پیش منتشر شده
تعداد بازدید: 482
کد پروژه: 142358
شرح پروژه
با سلام، با آرزوی قبولی طاعات
من میخوام مساله MSA رو به روش پیشرونده حل کنم
منظور از توالی دنباله ای از حروف الفیا هستش که پشت سرهم تکرار میشن
یعنی برای همترازی چند توالی میخوام اول توالی ها رو جفت جفت مقایسه کنم بعدش اون توالی هایی که تو همترازی جفتی امتیاز بالایی میگیرن رو تو اولویت قرار بدم و همترازی رو با اونا شروع کنم. (برای اینکه گپ کمتری استفاده بشه)
مثلا اگه چهار توالی A و B و C و D داشته باشیم، اول میام کل حالات ممکن برای همترازی جفتی رو در نظر میگیرم بعدش نمراتشو محاسبه میکنم. مثلا همترازی جفتی دو توالی AوB نمره 90 و همترازی جفتی دو توالی C و D نمره 80 گرفته که از همه حالات دیگه بالاتره
پس من اول A و B رو با هم الاینمنت میکنم بعد C و D رو با هم الاینمنت میکنم.
بعد هر الاینمنت رو به عنوان یک توالی منفرد در نظر میگیرم و خروجیشونو باهم الاینمنت میکنم. اینجوری هر جهار توالی با هم همتراز میشن.
برای نشون دادن توالی ها و ذخیره الاینمنت طبق مقاله GA-ACO میخوام فقط گپ ها رو توش ثبت کنم.
مثلا اگه همترازی سه توالی به صورت زیر باشه:
ABCD
A-P-
-BCC
من میخوام طبق مقاله GA-ACO فقط نماد گپ رو ثبت کنم تا حافظه کمتری مصرف بشه (طبق همون چیزی که توی مقاله GA-ACO گفته بود)، الاینمنت بالا این شکلی میشه:
(),(1,3),(0)
...
الگوریتم به عنوان وروی باید یک فایل FastA بگیره، که این فایل FastA چندین توالی داره که به صورت زیره:
> Seq1
FPPPSTRATSTCGATQWV…
> Seq2
KOPERVVWWSP…
> Seq3
ACGTAGCACHYHVQW….
.
.
.
بعد از الگوریتم Word2Vec استفاده میکنم. اول باید به کمک یک پنجره لغزان از توالیها k-mer استخراج بشه که این k-mer ها معادل کلمه یک سند هستن
توی مقاله DNA2VEC گفته بود اگه از توالیها 4-mer استخراج بشه بهتره
مثلا برای توالی ABCDEFG ما 4-merهای ABCD، BCDE، CDEF، DEFG داریم.
بعد به کمک الگوریتم Word2Vec این k-merها رو به بردار تبدیل میکنیم.
توی مقاله Nucl2Vec که همترازی محلی رو برای دو توالی انجام میداد، یه کار دیگه رو انجام میداد. اونجا برای دو توالی اول از هر دو توالی k-mer استخراج می کرد بعدش به کمک Word2Vec این k-mer ها رمزگذاری میشه بعدش توی دو فایل جداگانه ذخیره میکرد. بعد به کمک k-mer های توالی بلندتر یک درخت KNN تشکیل میداد و بعدش kmer های توالی کوتاه تر رو با کمک الگوریتم KNN تو درخت KNN جستجو میکرد و نزدیک ترین همسایه رو پیدا میکرد و بعدش به این ترتیب یه همترازی محلی رو تشکیل میداد.
حالا توی این الگوریتمی که میخوام پیاده سازی کنم، نمیدونم باید چطور همترازی سراسری رو برای چند توالی انجام بدم.
حالا بازم یه سری اطلاعات اضافی رو به همراه نمونه فایل ورودی پیوست کردم. سعی کردم اطلاعات کاملی رو ارائه بدم
این پروژه شامل 1 فایل مهم است، لطفا قبل از ارسال پیشنهاد حتما نسبت به بررسی این فایل اقدام فرمایید.
مهارت ها و تخصص های مورد نیاز
بودجه
300,000 تومان تا 750,000 تومان
مهلت برای انجام
20روز
وضعیت مناقصه
انجام شده
درباره کارفرما
عضویت چهار سال پیش
قادر به انجام این پروژه هستید؟
مهلت ارسال پیشنهاد قیمت برای این پروژه تمام شده است
به رایگان یک حساب کاربری بسازید
مهارتها و تخصصهای خود را ثبت کنید، رزومه و نمونهکارهای خود را نشان دهید و سوابق کاری خود را شرح دهید.
به شیوهای که دوست دارید کار کنید
برای پروژههای دلخواه در زمان دلخواه پیشنهاد قیمت خود را ثبت کنید و به فرصتهای شغلی منحصر به فرد دسترسی پیدا کنید.
با اطمینان دستمزد دریافت کنید
از زمان شروع کار تا انتهای کار به امنیت مالی شما کمک خواهیم کرد. وجه پروژه را از ابتدای کار به امانت در سایت نگه خواهیم داشت تا تضمین شودکه بعد از تحویل کار دستمزد شما پرداخت خواهد شد.
میخواهید شروع به کار کنید؟
یک حساب کاربری بسازید
بهترین مشاغل فریلنسری را پیدا کنید
رشد شغلی شما به راحتی ایجاد یک حساب کاربری رایگان و یافتن کار (پروژه) متناسب با مهارتهای شما
است.
پیدا کردن کار (پروژه)
تماشای دمو روش کار