Аннотация:
Достаточно распространена ситуация, когда результаты применения геномных сборщиков или одного сборщика с разными параметрами существенно отличаются для одних и тех же входных данных, при этом в настоящее время не существует единой методики выбора наилучшей сборки. В данной работе предложен новый метод оценки качества геномной сборки при отсутствии референса с помощью анализа частот $k$-меров на основе программного средства Jellyfish. Предложенный метод устанавливает соответствие между набором коротких чтений, полученных в результате секвенирования, и собранным геномом, позволяя более точно оценивать результат геномной сборки. В результате проверки метода на различных сборках организма Encephalitozoon cuniculi fungus было установлено, что в большинстве случаев предложенная методика коррелирует с референс-зависимыми метриками и позволяет корректно определять лучшую сборку. При этом не была выявлена взаимосвязь между качеством сборки и стандартными метриками.
Образец цитирования:
К. В. Романенков, “Метод оценки качества сборки генома на основе частот $k$-меров”, Препринты ИПМ им. М. В. Келдыша, 2017, 011, 24 с.
\RBibitem{Rom17}
\by К.~В.~Романенков
\paper Метод оценки качества сборки генома на основе частот $k$-меров
\jour Препринты ИПМ им.~М.~В.~Келдыша
\yr 2017
\papernumber 011
\totalpages 24
\mathnet{http://mi.mathnet.ru/ipmp2227}
\crossref{https://doi.org/10.20948/prepr-2017-11}