KIP-Veröffentlichungen

Jahr 2016
Autor(en) Simeon Scheib
Titel K - Ein Tool zur Analyse von genetischem Code mittels k-mer Analyse
KIP-Nummer HD-KIP 16-122
KIP-Gruppe(n) F18
Dokumentart Bachelorarbeit
Abstract (de)

Ziel dieser Arbeit ist die Entwicklung von Software, die es ermöglicht, die DNA-Sequenzen verschiedener Organismen schnell und einfach mittels Zählung von k-meren im genetischen Code zu analysieren, zu vergleichen und die Ergebnisse darzustellen. Insbesondere sollen auch verschiedene Features der Sequenz wie Gene, RNA, CDS, uvm. extrahiert und analog analysiert werden. Die Daten über die Sequenz und die Features stammen dabei aus Genbank-Dateien, wie sie in Datenbanken wie 'NCBI' abgelegt sind.  Um die Sequenzen zu vergleichen, sollen Histogramme der k-mer-Worte erstellt werden. Außerdem sollen aus diesen Histogrammen Korrelationskoeffizienten für verschiedene Korrelationsfunktionen berechnet und in Heatmaps grafisch dargestellt werden.

Abstract (en)

Objective of this thesis is the development of software to analyse and compare DNA-sequences by counting subsequences of length k and to present the results. Especially different features of the sequence like genes, RNA, CDS, etc. should be extracted and analysed analogously. The sequence data is taken from genbank-files as they are available in databases like 'NCBI'.  To compare the sequences, the software is supposed to create histograms of available k-mere subsequences. Furthermore these histograms should be correlated using different correlation functions. The resulting correlation coefficients are supposed to be presented graphically using heatmaps.

KIP - Bibliothek
Im Neuenheimer Feld 227
Raum 3.402
69120 Heidelberg