Abstract
Interaktionen zwischen Proteinen, sg. Protein-Protein-Interaktionen (PPIs), spielen eine
wesentliche Rolle innerhalb jedes Organismus. Durch den Einsatz von Hochdurchsatzverfahren
hat sich dasWissen über PPIs in den letzten Jahren vervielfacht.
Dadurch wurde es notwendig die anfallenden Informationen strukturiert der wissenschaftlichen
Gemeinde zur Verfügung zu stellen.
Der erste Teil dieser Diplomarbeit beschäftigt sich mit den wichtigsten primären und
sekundären PPI-Datenbanken. Sekundäre PPI-Datenbanken stellen durch die Integration
von mehreren primären Datenquellen dem Benutzer ein umfangreicheresWissen
bereit. Da sich die Datenbestände von primären PPI-Datenbanken überlappen, müssen
mehrfach auftretende PPIs erkannt werden. Dieser Vorgang nennt sich Duplikaterkennung
und ist von großer Bedeutung bei sekundären Datenbanken, um Redundanzen
und eine falsche Trennung der Daten zu vermeiden.
In dem zweiten Teil dieser Arbeit wird genauer auf die Methoden zur Duplikaterkennung
der unterschiedlichen Datenbanken eingegangen. Weiters wird ein neuer
Ansatz zur Erkennung von Duplikaten, die alignmentbasierte Duplikaterkennung, vorgestellt.
Dieser basiert auf einem paarweisen lokalen Alignment der Proteinsequenzen
und benötigt in der einfachsten Form keine weiteren Informationen. Mögliche
Algorithmen zur Berechnung der Alignments, sowie deren Parameter und Maßzahlen
werden evaluiert. Die Vor- und Nachteile dieser Methode werden dargelegt, sowie
die Qualität der alignmentbasierten Duplikaterkennung auf Testdatensätzen gemessen.
| Titel in Übersetzung | Duplicate detection in integrated PPI data sets by pairwise sequence alignment |
|---|---|
| Originalsprache | Deutsch |
| Publikationsstatus | Angenommen/Im Druck - 2007 |
Schlagwörter
- Datenintegration
- Duplikaterkennung
- Proteininteraktionen
- PPI
- PPI-Datenbanken
Fingerprint
Untersuchen Sie die Forschungsthemen von „Evaluierung alignmentbasierter Duplikaterkennung in integrierten PPI-Datenbeständen“. Zusammen bilden sie einen einzigartigen Fingerprint.Zitieren
- APA
- Author
- BIBTEX
- Harvard
- Standard
- RIS
- Vancouver