© Toth-Petroczy / MPI-CBG
Etwa 30 % aller Proteine weisen intrinsisch ungeordnete Regionen (IDRs) auf, bei denen es sich um strukturell flexible Proteinabschnitte handelt, die an vielen Funktionen eines Organismus beteiligt sind. Diese Regionen tendieren dazu, im Laufe der Zeit viele Sequenzänderungen (Mutationen) anzusammeln. Je mehr Sequenzunterschiede es gibt, desto schwieriger ist es zu erkennen, welcher Teil des Proteins für dessen Funktion verantwortlich ist.
Anders als bei strukturierten Proteinregionen, bei denen Motive – wiederkehrende Muster in Proteinsequenzen – mithilfe von Sequenzausrichtungen leicht zu finden sind, entwickeln sich intrinsisch ungeordnete Proteinregionen schnell, weshalb die verfügbaren Alignment-basierten Tools unzuverlässig sind.
Um dieses Problem zu lösen, hat die Forschungsgruppe von Agnes Toth-Petroczy am Max-Planck-Institut für molekulare Zellbiologie und Genetik (MPI-CBG) in Dresden und am Zentrum für Systembiologie Dresden (CSBD) nun SHARK-capture entwickelt, ein Alignment-freies Tool zur Erkennung von Motiven in diesen anspruchsvollen ungeordneten Regionen.
„SHARK-capture vergleicht Motive anhand von Aminosäureeigenschaften, ohne dass strenge Regeln erforderlich sind. Das Tool kann konservierte Motive präziser identifizieren als derzeitige Algorithmen. Es kann also den genauen, oft sehr kurzen Bereich der Sequenz, der für eine bestimmte Funktion verantwortlich ist, besser finden“, erklärt Chi Fung Willis Chow, Postdoktorand in der Toth-Petroczy-Gruppe und Erstautor der Studie.
In Zusammenarbeit mit der Gruppe von Simon Alberti am Biotechnologischen Zentrum der TU Dresden charakterisierte Willis experimentell ein neu entdecktes Motiv in dem Protein Ded1p, welches im Alberti-Labor untersucht wird. „In meinen Experimenten habe ich das vorhergesagte Motiv, das nur vier Aminosäuren lang ist, verändert oder gelöscht. Infolgedessen hatte das Protein nur die Hälfte der enzymatischen Aktivität, was die funktionelle Bedeutung dieses kurzen Motivs bestätigt“, beschreibt Willis.
Swantje Lenz, eine Postdoktorandin, die sowohl in der Toth-Petroczy-Gruppe und der Gruppe von Alexander von Appen am MPI-CBG arbeitet, wurde in das Projekt mit einbezogen, als der Algorithmus entwickelt wurde und einsatzbereit war. „Durch die Arbeit mit SHARK-capture konnte ich Willis Feedback geben, wie man Motive besser bewerten und priorisieren kann. Mit SHARK-capture habe ich 10.889 Motive in 2.695 Hefe-IDRs identifiziert und damit eine nützliche Ressource bereitgestellt. Ich habe festgestellt, dass viele davon bereits vorhandene experimentelle Daten wiedergeben“, sagt Swantje.
„SHARK-capture ist das genaueste Tool zum Auffinden konservierter Regionen in IDRs und als Python-Paket frei verfügbar. Letztendlich hoffen wir, dass es die Entdeckung der Sequenzdeterminanten ermöglicht, die der Vielzahl von Funktionen ungeordneter Regionen zugrunde liegen“, fasst Agnes zusammen.
Erstautoren der Publikation Swantje Lenz (links) and Chi Fung Willis Chow (rechts). © Katrin Boes / MPI-CBG
Chi Fung Willis Chow, Swantje Lenz, Maxim Scheremetjew, Soumyadeep Ghosh, Doris Richter, Ceciel Jegers, Alexander von Appen, Simon Alberti, & Agnes Toth-Petroczy. SHARK-capture identifies functional motifs in intrinsically disordered protein regions. Protein Science. 2025; 34(4):e70091. https://doi.org/10.1002/pro.70091