Informations

Les monomères protéiques quaternaires sont-ils uniques à un complexe protéique particulier ?


Je sais que les structures des protéines quaternaires se forment exclusivement via des liaisons non covalentes. Mon professeur de biochimie a discuté d'une capside virale qui est essentiellement une structure quaternaire avec 240 monomères individuels de 4 types. Je soupçonne que pour que cette enveloppe protéique soit stable, les liaisons non covalentes qui la maintiennent ensemble doivent être plutôt stable. Il a également mentionné que différents monomères peuvent se joindre pour former le complexe protéique fonctionnel à des distances relativement éloignées, comme à travers une cellule entière, ce qui me porte encore une fois à croire que les deux monomères doivent interagir les uns avec les autres. très fortement.

Ma question est la suivante : étant donné qu'une forte interaction non covalente est requise entre (au moins) deux monomères protéiques pour former la structure quaternaire fonctionnelle, une protéine particulière peut-elle être un monomère pour un ensemble de complexes quaternaires différents ? Y a-t-il des exemples de cela?


Si je comprends bien la question, vous pensez à quelque chose du genre des domaines tertiaires modulaires, mais dans un sens quaternaire ?

Pour une interaction réversible, les protéines G hétérotrimériques viennent à l'esprit. Une fois activés par un récepteur couplé aux protéines G (RCPG), la sous-unité alpha et le complexe bêta-gamma se dissocient du récepteur et l'un de l'autre. Ils peuvent tous deux affecter la signalisation en se liant à diverses protéines effectrices, selon la voie particulière dans laquelle ils sont impliqués, et leurs activités peuvent être médiées par d'autres protéines (par exemple, la sous-unité alpha GTPase régulée par les protéines GAP).

J'ai parlé à mon professeur d'ingénierie des protéines, et elle m'a également dirigé vers quelques exemples, bien que je ne sois pas sûr qu'ils correspondent tout à fait à ce que vous recherchez au sens le plus strict.

  • Les kinases dépendantes des cyclines, comme l'a mentionné @Armatus, se lient à toutes sortes de cyclines différentes. (J'ai l'impression que les sous-unités trouvées dans plusieurs complexes protéiques seront probablement plus courantes dans les cascades de signaux. Je n'ai pas de données réelles à ce sujet, mais il est logique qu'une protéine de signal puisse interagir avec deux ou plusieurs complexes protéiques et même ont des fonctions légèrement différentes dans chacun.)
  • L'alcool déshydrogénase (ADH) est un exemple de protéine avec des structures quaternaires différentes entre les espèces. Selon mon professeur, il se présente sous forme d'homodimère chez les mammifères, mais sous forme de tétramère avec des résidus légèrement différents dans la levure bourgeonnante. Je ne peux pas dire si les changements de séquence sont ce qui affecte l'oligomérisation, bien que mon prof ait également mentionné des "domaines d'oligomérisation" qui pourraient médier les interactions protéine-protéine.
  • Elle m'a également dirigé vers un exemple un peu plus intéressant (à mon avis), même si, encore une fois, il s'agit également plus d'une oligomérisation. Les petites protéines de choc thermique (sHSP) subissent ce qu'on appelle un « échange dynamique de sous-unités » et peuvent adopter une grande variété d'architectures oligomères. La liaison est transitoire, mais c'est quand même plutôt soigné. Il y a une critique ici : http://www.sciencedirect.com/science/article/pii/S0968000411001903. La figure 3 montre différentes architectures oligomères d'un seul monomère.

Il semble que pratiquement toutes les protéines qui interagissent avec deux ou plusieurs complexes protéiques distincts pourraient être considérées comme une réponse. Ni moi ni mon professeur n'avons réussi à trouver un exemple d'assemblage irréversible de sous-unités communes, mais elle est d'avis que, dans toutes les différentes structures protéiques possibles, il y a probablement au moins un exemple de tout, peu importe comment bizarre il semble.


La structure tridimensionnelle du complexe biotine carboxylase-protéine porteuse de biotine carboxyle de l'acétyl-CoA carboxylase d'E. coli

L'acétyl-coenzyme A (acétyl-CoA) carboxylase est une enzyme multifonctionnelle dépendante de la biotine qui catalyse l'étape régulée de la synthèse des acides gras. L'enzyme Escherichia coli est composée d'une biotine carboxylase homodimérique (BC), d'une protéine biotinylée porteuse de biotine carboxyle (BCCP) et d'une 2β2 hétérotétramère carboxyltransférase. Ce complexe enzymatique catalyse deux demi-réactions pour former la malonyl-coenzyme A. BC et BCCP participent à la première demi-réaction, tandis que la carboxyltransférase et la BCCP sont impliquées dans la seconde. Des structures tridimensionnelles ont été signalées pour les sous-unités individuelles, cependant, la base structurelle de la réaction de BCCP avec la carboxylase ou la transférase est inconnue. Par conséquent, nous rapportons ici la structure cristalline d'E. coli BCCP complexé avec BC à une résolution de 2,49 Å. Le complexe protéine-protéine présente une structure quaternaire unique et deux interfaces distinctes pour chaque monomère BCCP. Ces sites de liaison BCCP sont uniques par rapport aux carboxylases biotine-dépendantes apparentées sur le plan phylogénétique et fournissent donc de nouvelles cibles pour le développement d'antibiotiques contre l'acétyl-CoA carboxylase bactérienne.

Copyright © 2013 Elsevier Ltd. Tous droits réservés.

Les figures

Figure 1. Réaction catalysée par l'acétyl-CoA carboxylase

Figure 1. Réaction catalysée par l'acétyl-CoA carboxylase

La réaction 1 est catalysée par la biotine carboxylase et…

Figure 2. Structure quaternaire du BCCP-BC…

Figure 2. Structure quaternaire du complexe BCCP-BC

(A–C) Rendu de surface du complexe BCCP-BC…

Figure 3. Superposition de BCCP

Figure 3. Superposition de BCCP

Superposition de E. coli BCCP du complexe BCCP-BC (violet)…

Figure 4. Les interfaces complexes BCCP-BC

Figure 4. Les interfaces complexes BCCP-BC

L'oxygène, l'azote, les atomes de soufre et l'eau sont représentés dans…

Figure 5. Biotine Carboxylase de E. coli…

Figure 5. Biotine Carboxylase de E. coli Superposé sur le domaine de la biotine carboxylase de R.…


Carbone

On dit souvent que la vie est "à base de carbone". Cela signifie que les atomes de carbone, liés à d'autres atomes de carbone ou à d'autres éléments, forment les composants fondamentaux de nombreuses, sinon de la plupart, des molécules présentes uniquement dans les êtres vivants. D'autres éléments jouent un rôle important dans les molécules biologiques, mais le carbone est certainement considéré comme l'élément de « fondation » des molécules dans les êtres vivants. Ce sont les propriétés de liaison des atomes de carbone qui sont responsables de son rôle important.


Résultats et discussion

Restriction réciproque du mouvement des récepteurs de l'adénosine dans la membrane plasmique

Pour examiner la dynamique de A1R-A2AR hétéromères dans la membrane plasmique d'une cellule vivante, le mouvement des récepteurs marqués avec des protéines fluorescentes (A1Protéine fluorescente R-verte [GFP] ou A2AR-mCherry) a été mesurée par suivi de particules uniques (SPT) en temps réel (Fig. 1). Des exemples d'images fluorescentes et de trajectoires de particules individuelles sont présentés dans le fichier supplémentaire 1 : Figure S1. Analyse des données correspondant à 500 A1Les particules R-GFP ont montré une relation linéaire entre le déplacement quadratique moyen (MSD) et le décalage temporel dans les trajectoires de jusqu'à 1600 particules fluorescentes simples (Fig. 1a, c). Ceci est typique de la diffusion brownienne, indiquant un manque de restrictions dans A1Mouvement R-GFP. Co-expression de A2AR-mCherry (Fig. 1b) a conduit à une réduction de la mobilité latérale de A1R-GFP, qui est devenu confiné aux régions de la membrane plasmique de 0,461 ± 0,004 m de diamètre. Son coefficient de diffusion est passé de 0,381 ± 0,002 m 2 /s à 0,291 ± 0,003 m 2 /s (p = 0,002, test t unilatéral). De même, A1R-GFP a également diminué le A2ACoefficient de diffusion R-mCherry de 0,317 ± 0,002 m 2 /s à 0,143 ± 0,005 m 2 /s (p < 0,0001) (Fig. 1d–f). UNE2AR s'est déplacé dans une zone de confinement de 0,941 ± 0,007 m de diamètre qui a été réduite à 0,360 ± 0,001 m (p < 0,0001) lorsque les deux récepteurs étaient co-exprimés. Nous concluons de ces comparaisons de mobilité que le mouvement réciproquement restreint des particules réceptrices individuelles doit être dû à A1R-A2AInteractions récepteur-récepteur R.

Mobilité de surface cellulaire de A1R-GFP et A2AR-mCherry. Trajectoires individuelles de particules contenant de la GFP fusionnées à l'extrémité C-terminale de A1R (A1-GFP) (une et b) ou mCherry fusionné à l'extrémité C-terminale de A2AR (A2A-mCerise) ( et e) sur des cellules HEK-293T exprimant A1-GFP (a), A2A-mCherry (d) ou les deux (b et e). La trajectoire et l'intensité de fluorescence des particules individuelles ont été enregistrées au fil du temps à l'aide d'une microscopie à réflexion interne totale (TIRFM) et d'un enregistrement par caméra à dispositif à couplage de charges multiplicateur d'électrons (EMCCD). Le mouvement du récepteur a été déterminé en traçant (par rapport au décalage temporel) le déplacement quadratique moyen (MSD) d'A1-GFP (c) en l'absence (ligne noire) ou présence de A2A-mCerise (Ligne bleue), ou A2A-mCerise (F) en présence (ligne noire) ou présence de A1-GFP (Ligne bleue). Les ensembles de données ont été ajustés à des modèles mathématiques de diffusion libre et confinée pour A1R et A2AR respectivement. g Co-localisation de A1-GFP et A2A-mCherry est observé (points jaunes). Barre d'échelle : 100 nm. h Distribution du signal de fluorescence de A1-GFP (la gauche) et A2A-mCerise (droit) au sein de récepteurs co-localisés (points jaunes en g). Les courbes délimitent approximativement le nombre de monomères, dimères ou trimères au sein du complexe co-localisé. je Analyse stœchiométrique réalisée pour A co-localisé1-GFP et A2A-Particules du récepteur mCherry co-exprimées dans les cellules HEK-293T (points jaunes en g). Vert correspond à A1-GFP et rouge à un2A-mCerise

Stœchiométrie de A1 et un2A hétérocomplexes récepteurs

La stoechiométrie des récepteurs fluorescents à la surface cellulaire peut être calculée à partir de la distribution de luminosité des particules individuelles [19] (voir « Méthodes »). Dans les cellules exprimant A1R-GFP, nous avons trouvé que la majorité des clusters se composent de deux (

34 % de récepteurs, et les clusters avec un ou trois récepteurs étaient rares (

9 %, respectivement) (Fichier supplémentaire 2 : Figure S2A et barres noires dans Fichier supplémentaire 2 : Figure S2C). Dans le cas d'A2AR-mCherry, l'analyse stœchiométrique a montré que les clusters exprimaient principalement des trimères (45 %), avec des dimères (29 %) et des tétramères (12 %) les deuxième et troisième populations les plus courantes (Fichier supplémentaire 2 : Figure S2D et barres noires dans Additional fichier 2 : Figure S2F). Remarquablement, cette stoechiométrie pour A1 ou un2A récepteurs a été altéré lorsque le récepteur partenaire a également été exprimé. Dans les cellules co-exprimant A1R-GFP et A2AR-mCherry, la population de dimères a augmenté (57 % pour A1R-GFP et 49 % pour A2AR-mCherry, barres bleues dans le fichier supplémentaire 2 : figures S2C, F) et est devenue l'espèce prédominante (fichier supplémentaire 2 : figures S2B, C, E, F).

Afin de concentrer l'analyse sur les complexes hétéromères, nous avons identifié des grappes contenant les deux récepteurs (points jaunes individuels sur la figure 1g, affichant à la fois la fluorescence GFP et mCherry). Dans

1000 clusters co-localisés analysés qui consistaient en un mélange de A1-GFP et A2A-Cherry (points jaunes sur la figure 1g), nous avons trouvé une quantité similaire de dimères de A1R (75 %, panneau de gauche sur la figure 1h et barre verte sur la figure 1i) et A2AR (74 %, panneau de droite sur la figure 1h et barre rouge sur la figure 1i). Trimères et tétramères de A1R, et les monomères et tétramères de A2AR, étaient minoritaires ou négligeables (voir Fig. 1h, i). En résumé, étant donné que le pourcentage de dimères de A1R-GFP ou A2AR-mCherry dans les points jaunes (qui montrent la co-localisation des deux récepteurs) était similaire et élevé (

75 %), l'hétérotétramère contenant deux A1Rs et deux A2ARs doit avoir été l'espèce la plus prédominante. A notre connaissance, il s'agit des premières données de stoechiométrie pour un hétéromère GPCR dans des cellules vivantes.

Disposition des protéines G interagissant avec A1 et un2A récepteurs

Les GPCR monomères sont capables d'activer les protéines G [20]. Cependant, des découvertes récentes suggèrent qu'un homodimère GPCR lié à une seule protéine G peut être une unité fonctionnelle commune [21]. Ainsi, une question émergente est de savoir comment les protéines G se couplent aux hétéromères GPCR. Parce qu'un1R se couple sélectivement à Gje et un2AR à Gs [22], l'hypothèse de travail était que les deux Gje et Gs les protéines peuvent se coupler à l'A1R-A2AR hétérotétramère. Pour tester cette hypothèse, nous avons utilisé des tests de transfert d'énergie par résonance de bioluminescence (BRET) [23]. En accord avec les expériences SPT (voir ci-dessus), des homodimères et hétérodimères ont été détectés par des tests BRET dans des cellules exprimant A1R fusionné avec Renilla luciférase (A1R-Rluc) ou protéine fluorescente jaune (A1R-YFP) (Fig. 2a), A2AR-Rluc et A2AR-YFP (Fig. 2b), ou A1R-Rluc et A2AR-YFP (Fig. 2e). Ni un1R-Rluc ni A2AR-YFP a interagi avec le récepteur de la ghréline 1a fusionné à YFP (GHS1a-YFP), utilisé comme contrôle en tant que protéine incapable d'interagir directement avec ces récepteurs d'adénosine (Fig. 2a, b). Afin de tester la présence des deux protéines G dans l'hétérotétramère, nous avons transfecté des cellules avec des minigènes qui codent pour des peptides bloquant soit Gje ou Gs liaison aux GPCR [24]. De plus, les cellules ont été traitées avec des toxines de la coqueluche ou du choléra qui catalysent l'ADP-ribosylation de Gje ou Gs. Clairement, traiter les cellules avec la toxine coquelucheuse ou exprimer le peptide codé par le minigène qui bloque αje couplage, réduit la valeur du BRETmax pour un1R-A1R homodimères (Fig. 2a) et pour A1R-A2Ahétérodimères R (Fig. 2e) mais pas pour A2AR-A2AR homodimères (Fig. 2b). Cela indique que Gje est couplé à A1R dans l'homodimère et l'hétérodimère. De même, bloquer Gs-interaction récepteur utilisant la toxine cholérique ou un peptide codé par un minigène qui bloque αS accouplement réduit BRETmax pour un2AR-A2AR homodimères (Fig. 2b) et pour A1R-A2Ahétérodimères R (Fig. 2e) mais pas pour A1R-A1R homodimères (Fig. 2a). Fait intéressant, les courbes BRET ont montré une sensibilité aux toxines du choléra et de la coqueluche dans les cellules exprimant soit A1R-Rluc-A1R-YFP et A2AR (Fig. 2c) ou A2AR-Rluc-A2AR-YFP et A1R (Fig. 2d). La fonctionnalité des constructions et des contrôles dans les cellules exprimant les minigènes, et dans les cellules exprimant le récepteur de la ghréline GHS1a au lieu de l'un des récepteurs de l'adénosine, est présentée dans le fichier supplémentaire 3 : Figure S3. Pour confirmer davantage que Gje lie A2AR dans l'hétéromère récepteur, le transfert d'énergie entre Rluc fusionné au domaine N-terminal de la sous-unité de Gje (Gje-Rluc) et A2ALa R-YFP a été analysée dans des cellules co-exprimant ou non A1R (Fig. 2f). Une courbe de BRET hyperbolique a été observée en présence de A1R, mais pas en son absence, indiquant que Gje et Gs sont liés à leurs homodimères de récepteurs respectifs dans le A1R-A2AR hétéromère.

Influence des protéines G sur A1R et A2AR homodimérisation et hétérodimérisation. B Les courbes de saturation du transfert d'énergie par résonance de bioluminescence (BRET) ont été réalisées dans des cellules HEK-293T 48 h après la transfection avec (une, c) 0,3 µg d'ADNc correspondant à A1R-Rluc et des quantités croissantes de A1R-YFP (0,1 à 1,5 g d'ADNc) ou GHS1a-YFP (0,25 à 2 g d'ADNc) comme contrôle négatif (a, Ligne mauve), sans (a) ou avec (c) 0,15 µg d'ADNc correspondant à A2AR (b, ) 0,2 µg d'ADNc correspondant à A2AR-Rluc et des quantités croissantes de A2AR-YFP (0,1 à 1,0 g d'ADNc) ou GHS1a-YFP (0,25 à 2 g d'ADNc) comme contrôle négatif (b, Ligne mauve), sans (b) ou avec (d) 0,5 µg d'ADNc correspondant à A1R (e) 0,3 µg d'ADNc correspondant à A1R-Rluc et des quantités croissantes de A2AR-YFP (0,1 à 1,0 g d'ADNc) et (F) 0,5 µg d'ADNc correspondant à A1R (sauf contrôle courbes bleues qui ont été obtenus dans des cellules n'exprimant pas A1R), 2 µg d'ADNc correspondant à Gje-Rluc, et des quantités croissantes de A2AR-YFP (0,1 à 0,5 ug d'ADNc). Dans les panels a, b et e, les cellules ont également été transfectées avec 0,5 g d'ADNc correspondant au Gje-en relation (courbes oranges) ou Gs-en relation (courbes bleues) minigènes. Les cellules ont été traitées pendant 16 h avec du milieu (courbes noires), avec 10 ng/ml de toxine coquelucheuse (courbes vertes), ou avec 100 ng/ml de toxine cholérique (courbes rouges) avant la détermination du BRET. Pour confirmer des expressions de donneur similaires (environ 100 000 unités de bioluminescence) tout en surveillant l'augmentation de l'expression de l'accepteur (1000 à 40 000 unités de fluorescence), la fluorescence et la luminescence de chaque échantillon ont été mesurées avant l'acquisition des données de transfert d'énergie. Unité MiliBRET (mBU) sont la moyenne ± erreur standard de la moyenne de quatre à six expériences différentes regroupées en fonction de la quantité d'accepteur de BRET. Dans chaque panneau (Haut) un dessin animé met en scène les protéines auxquelles Rluc et YFP ont été fusionnés et la présence ou non de récepteurs partenaires et/ou Gs ou Gje protéines [les schémas de c à f ne sont pas destinés à illustrer sur la stoechiométrie car la forme prédominante dans les cellules exprimant les deux récepteurs était l'hétérotétramère contenant deux A1 et deux A2A récepteurs (voir « Résultats »)]

De plus, deux expériences BRET complémentaires ont été réalisées pour déterminer l'orientation de Gje et Gs au sein de l'A1R-A2AR hétérocomplexe. Premièrement, Rluc et YFP ont été fusionnés respectivement aux domaines N-terminaux de la sous-unité de Gjeje-Rluc) et Gss-YFP) (Fig. 3, barre a) en second lieu, ils ont été fusionnés au domaine N-terminal de la sous-unité (γ-Rluc et γ-YFP) (Fig. 3, barre b). Nous avons observé un transfert d'énergie significatif entre γ-Rluc et γ-YFP dans les cellules co-exprimant A1R et A2AR (Fig. 3, barre b) mais des quantités minimes dans les cellules témoins négatives (Fig. 3, barres c et d). Dans les cellules exprimant soit A1R ou A2AR, le transfert d'énergie entre γ-Rluc et γ-YFP était également faible (Fig. 3, barres e et f), suggérant que les dimères mais pas les tétramères étaient la forme la plus répandue de récepteurs de surface dans les cellules transfectées simples. Ces résultats dans les cellules co-transfectées corroborent la stoechiométrie 2:2 obtenue à partir de l'analyse de la fluorescence dans les particules individuelles et sont cohérents avec Gje et Gs liant à ces A1R-A2AR hétérotétramères.

gs et Gje couplage à l'adénosine A1R-A2AR hétérocomplexes. Des expériences de transfert d'énergie par résonance de bioluminescence (BRET) ont été réalisées dans des cellules HEK-293T 48 h après la transfection avec (une, b) 0,2 µg d'ADNc correspondant à A1R et 0,15 µg d'ADNc correspondant à A2AR (c, ) 0,2 µg d'ADNc correspondant à A1R ou 0,15 µg d'ADNc correspondant à A2AR et 0,4 µg d'ADNc correspondant au récepteur sécrétagogue de l'hormone de croissance GHS1a (e) 0,2 µg d'ADNc correspondant à A1R ou (F) 0,15 µg d'ADNc correspondant à A2AR. Les cellules ont également été transfectées avec 2 g d'ADNc correspondant à la sous-unité de Gje fusionné à Rluc et des quantités croissantes d'ADNc correspondant à la sous-unité de Gs fusionné à YFP (a) ou 0,3 g d'ADNc correspondant à la sous-unité fusionnée à Rluc et des quantités croissantes d'ADNc correspondant à la sous-unité fusionnée à YFP (b-f). Unité miliBRET maximale (mBU) sont la moyenne ± erreur standard de la moyenne de quatre expériences différentes. Un schéma montrant la protéine à laquelle Rluc et YFP ont été fusionnés est fourni (Haut). ***p < 0,001 par ANOVA unidirectionnelle avec test de Dunnett post-hoc

Modèle moléculaire de Gje et Gs lié au A1R-A2AR hétérotétramère

Pour identifier l'orientation de la protéine G dans le récepteur homodimère, nous avons combiné des tests de transfert d'énergie entre αs-Rluc (Rluc à l'extrémité N-terminale de la sous-unité de la protéine G) et A2AR-YFP (Fig. 4a) avec des informations sur les interfaces transmembranaires (TM) basées sur les structures cristallines des GPCR [3, 4], qui ont été récemment résumées [25]. Le transfert de haute énergie observé en utilisant αs-Rluc et A2AR-YFP a indiqué la proximité étroite entre la queue N de la sous-unité de Gs et la queue C de A2AR. Fait intéressant, Rluc et YFP dans le "monomère" A2AR-Gs complexes (voir « Méthodes ») pointent vers des positions éloignées dans l'espace (Fig. 4b). Par conséquent, le BRET observé devrait se produire entre Rluc dans la sous-unité de la protéine G et un second A2AProtomère R-YFP. Parmi toutes les interfaces TM décrites pour l'homodimérisation des récepteurs (voir Fichier supplémentaire 4 : Figure S4), nous proposons l'interface TM4/5, qui est observée dans la structure oligomérique de β1-AR [4] et dans des structures dérivées de simulations de dynamique moléculaire (MD) à gros grains [26]. En fait, c'est la seule interface qui favorise le BRET entre αs-Rluc et un deuxième A2AProtomère R-YFP dans un homodimère (Fig. 4c). L'homologue A1L'homodimère R a été construit en utilisant la même interface TM4/5 que pour A2AR (voir Fichier complémentaire 4 : Figure S4 et sa légende).

Orientation d'une protéine G dans un récepteur homodimère. Des expériences de saturation par transfert d'énergie par résonance de bioluminescence (BRET) ont été réalisées dans des cellules HEK-293T transfectées avec 2 g d'ADNc correspondant à la sous-unité de Gs fusionné à Rluc et des quantités croissantes de A2AADNc de R-YFP (0,1 à 0,5 ug). une Mesures de BRET dans des cellules prétraitées pendant 16 h avec du milieu (ligne noire) ou avec 100 ng/ml de toxine cholérique (ligne rouge). La fluorescence et la luminescence de chaque échantillon ont été mesurées avant chaque expérience pour confirmer des expressions de donneur similaires (environ 50 000 unités de bioluminescence) tout en surveillant l'augmentation de l'expression de l'accepteur (1000 à 10 000 unités de fluorescence). unité miliBRET (mBU) sont la moyenne ± erreur standard de la moyenne de quatre à cinq expériences différentes regroupées en fonction de la quantité d'accepteur de BRET. Un schéma de placement des fragments BRET donneur et accepteur est fourni (Haut). b Modèle moléculaire de l'A2AR-Gs complexe. Rluc (bleu) est attaché à l'hélice αN N-terminale de Gs (gris) et YFP (jaune) est attaché au domaine C-terminal de A2AR (vert clair) (voir Fichier supplémentaire 9 : Figure S9 pour plus de détails). c Disposition d'un2AR homodimères modélisés via l'interface TM4/5 comme observé dans la structure oligomérique de β1-AR [4]. Le A2AProtomère R lié à αs est montré dans vert clair, tandis que le deuxième A2ALe protomère R-YFP est montré dans vert foncé. Le modèle moléculaire en panneau c (BRET entre Rluc en Gs α sous-unité et YFP dans un second A2ADistance centre à centre du protomère R entre Rluc et YFP de 6,5 nm), contrairement au modèle présenté dans le panneau B (BRET entre Rluc dans Gs sous-unité et YFP dans la protéine G liée A2AR protomère distance centre à centre entre Rluc et YFP de 8,3 nm), favoriserait le transfert de haute énergie observé (voir panneau a) entre αs-Rluc et A2AR-YFP

Les autres TM possibles capables de former des interfaces hétéromériques sont TM1 et TM5/6 (Fig. 5). Les deux sont des interfaces inter-GPCR possibles comme observé dans la structure du récepteur -opioïde (μ-OR) [3]. Pour discerner entre ces deux possibilités, une stratégie de complémentation de fluorescence bimoléculaire a été entreprise. Pour cela, le fragment N-terminal de Rluc8 a été fusionné à A1R (A1R-nRluc8) et son domaine C-terminal à A2AR (A2AR-cRluc8), qui seulement après complémentation peut agir en tant que donneur de BRET (Rluc8). La protéine accepteur BRET a été obtenue par complémentation du fragment N-terminal de la protéine YFP Venus fusionnée à A1R (A1R-nVenus) et son domaine C-terminal fusionné à A2AR (A2AR-cVénus). Lorsque les quatre constructions de récepteur ont été transfectées, nous avons obtenu un signal BRET positif et saturable (BRETmax de 35 ± 2 mBU et BRET50 de 16 ± 3 mBU) qui n'a pas été obtenu pour les contrôles négatifs (Fichier supplémentaire 5 : Figure S5). La figure 5a, b montre que l'hémi-donneur (A1R-nRluc8 et A2AR-cRluc8) et l'hémi-accepteur (A1R-nVénus et A2AR-cVenus), placés à l'extrémité C-terminale des récepteurs, ne peuvent se compléter que si A1R-A2AL'hétérodimérisation R se produit via l'interface TM5/6. L'interface TM4/5 pour l'homodimérisation et l'interface TM5/6 pour l'hétérodimérisation donnent une organisation tétramère en forme de losange (Fig. 5a). Remarquablement, la pré-incubation des cellules avec les toxines de la coqueluche ou du choléra a diminué le BRETmax de 35 % (Fig. 5c), suggérant en outre que les deux Gs et Gje les protéines se lient au A1R-A2AR hétérotétramère.

Construction assistée par transfert d'énergie par résonance de bioluminescence (BRET) d'un modèle composé de Gje et Gs lié à un A1R-A2AR hétérotétramère. une, b UNE1R-A2ATétramère R construit à l'aide d'interfaces inter-récepteurs TM5/6 (a) ou TM1 (b) modélisées comme dans la structure du récepteur opioïde [3]. Les hélices TM 1, 4 et 5, impliquées dans la dimérisation des récepteurs, sont mises en évidence dans bleu foncé, bleu clair, et gris, respectivement. nRluc8 et cRluc8 sont affichés dans bleu et nVenus et cVenus dans jaune foncé. c Des expériences de BRET et de complémentation de fluorescence bimoléculaire ont été réalisées dans des cellules HEK-293T transfectées avec 1,5 µg d'ADNc correspondant à A1R-cRluc8 et A2AR-nRluc8, et 1,5 µg d'ADNc correspondant à A1R-nVénus et A2AR-cVénus. Comme contrôle négatif, les cellules ont été transfectées avec 1 g d'ADNc correspondant à nRluc8 et 1,5 g d'ADNc correspondant à A2AR-nRluc8, A1R-nVénus et A2AR-cVénus. Les cellules ont été traitées pendant 16 h avec du milieu (– les toxines), 10 ng/ml de toxine coquelucheuse (+ coqueluche), ou 100 ng/ml de toxine cholérique (+ choléra) avant la détermination du BRET. La quantité relative de BRET est donnée comme sur la figure 4 et les valeurs sont la moyenne ± erreur standard de la moyenne de trois expériences différentes. Le test t de Student a montré des différences statistiquement significatives par rapport au contrôle ( # p < 0.05, ## p < 0,01) et un effet significatif en présence de l'une ou l'autre toxine sur BRET en l'absence de toxines (*p < 0.05). Une représentation schématique au Haut montre la protéine à laquelle les protéines hémiluminescentes ou fluorescentes ont été fusionnées. Modèle moléculaire de l'A1R-A2Atétramère R en complexe avec Gje et Gs. UNE1R lié à Gje est montré dans rouge, Gje-unbound A1R est montré dans Orange, UNE2AR lié à Gs est montré dans vert foncé, Gs-unbound A2AR est montré dans vert clair, et les sous-unités , - et de Gje et Gs sont montrés dans gris foncé, gris clair, et violet, respectivement. Les hélices transmembranaires 4 et 5 sont mises en évidence dans bleu clair et gris, respectivement

Nous avons ensuite évalué, à l'aide d'outils informatiques, si la proposition A1R-A2AL'hétérotétramère R pourrait se coupler aux deux Gje et Gs protéines. De toute évidence, les protomères externes de l'A proposé1R-A2AL'hétérotétramère R peut se lier à Gje et Gs protéines (Fig. 5d). Ce modèle positionne les sous-unités de Gje et Gs en contact étroit, face à l'intérieur du complexe tétramérique, tandis que les hélices N-terminales de αje ets point à l'extérieur du complexe. Les hélices -terminales des sous-unités sont très proches, tournées vers l'intérieur (Fichier complémentaire 6 : Figure S6), ce qui explique le transfert d'énergie important observé entre γ-Rluc et γ-YFP (Fig. 3, barre b). Le modèle fournit des informations expérimentales sur l'arrangement structurel des hétéromères constitués de deux GPCR et couplés à deux protéines G, dont la possibilité a été récemment discutée [25]. Nous avons utilisé des simulations MD pour étudier la stabilité de ce complexe. Fichier supplémentaire 7 : La figure S7 montre les écarts quadratiques moyens (rmsd) sur les protéines α-carbones tout au long de la simulation MD, ainsi que les distances intermoléculaires clés entre les protomères et les protéines G. De toute évidence, à la fois l'A1Protomère R lié à Gje et l'A1Le protomère R qui n'interagit pas avec lui a maintenu une similitude structurelle étroite (rmsd ≈ 0,3 nm) par rapport aux structures initiales. Des résultats similaires ont été obtenus pour l'A2AProtomères R (liés et non liés à Gs) (Fichier supplémentaire 7 : Figure S7A). Le fait que les valeurs rmsd de l'ensemble du système, formé par le A1R-A2AR hétérotétramère lié à Gje et Gs, sont de l'ordre de 0,6 nm indique que le modèle structurel initial est maintenu lors de la simulation MD (Fichier supplémentaire 7 : Figure S7A). En conséquence, les distances intermoléculaires sélectionnées entre les protomères et les protéines G restent constantes pendant la simulation MD (Fichier supplémentaire 7 : Figure S7B). Un aspect clé de l'assemblage de l'hétérotétramère est constitué par les interfaces TM pour l'homodimérisation (TM4/5) et l'hétérodimérisation (TM5/6). Fichier supplémentaire 8 : La figure S8B montre les valeurs rmsd du faisceau à quatre hélices formant les interfaces TM4/5 et TM5/6, les instantanés initiaux et finaux de ces faisceaux, et l'évolution de l'A1R-A2AR hétérotétramère lors de la simulation MD. De toute évidence, les variations structurelles plutôt faibles de ces faisceaux à quatre hélices, également reflétées par rmsd <0.3 nm, suggèrent un complexe stable. Notamment, le bundle à quatre hélices TM5/6 semble plus stable que les bundles TM4/5, comme le montre sa valeur rmsd plus faible. Fichier complémentaire 8 : La figure S8B, C représente les cartes de contact des interfaces TM4/5 et TM5/6, ainsi que l'évolution du réseau d'interactions hydrophobes au sein de ces interfaces lors de la simulation MD.


Remerciements

Je remercie tous les collègues de SP natifs qui ont contribué à faire mûrir ce domaine de recherche. Je remercie tous les membres de mon groupe, plus particulièrement les (anciens) membres natifs de MS dont j'ai utilisé le matériel et les contributions ici K. Lorenzen, H. Mazon, M. Pinkse, S. Synowsky, C. Uetrecht, R. van den Heuvel , E. van Duijn et C. Versluis. K. Lorenzen et C. Uetrecht ont aidé à construire les figures. De plus, je remercie tous les collaborateurs dont les échantillons, le soutien et l'expertise ont été déterminants dans notre travail.


Résumé

Les gènes codant pour les systèmes toxine-antitoxine (TA) sont presque omniprésents dans les génomes bactériens et ils jouent un rôle clé dans des aspects importants de la physiologie bactérienne, notamment la stabilité génomique, la formation de cellules persistantes sous stress antibiotique et la résistance aux infections phagiques. Le locus CptIN de Eubactérie rectale est un membre de la classe de systèmes TA de type III récemment découverte, définie par une toxine protéique supprimée par interaction directe avec une antitoxine ARN structurée. Ici, nous présentons la structure cristalline du complexe protéine-ARN CptIN à une résolution de 2,2 Å. La structure révèle une nouvelle organisation quaternaire hétérotétramère pour la classe TA de type III, et l'antitoxine d'ARN porte une nouvelle caractéristique structurelle d'un motif de torsion A étendu dans le pli pseudonoeud. La rétention d'un site actif de ribonucléase conservé ainsi que des traits normalement associés aux systèmes TA, tels que la maintenance des plasmides, implique un rôle fonctionnel plus large pour les systèmes TA de type III. Nous présentons des preuves de la co-variation de la paire de composants de type III, mettant en évidence un processus évolutif distinctif dans lequel une enzyme et son substrat co-évoluent.


Définition et exemples de monomère

Un monomère est une molécule qui forme l'unité de base des polymères, qui sont les éléments constitutifs des protéines. Les monomères se lient à d'autres monomères pour former des molécules à chaîne répétitive par un processus connu sous le nom de polymérisation. Les monomères peuvent être d'origine naturelle ou synthétique.

Les oligomères sont des polymères constitués d'un petit nombre (généralement moins de 100) de sous-unités monomères. Les protéines monomères sont des molécules protéiques qui se combinent pour former des complexes multiprotéiques. Les biopolymères sont des polymères constitués de monomères organiques présents dans les organismes vivants.

Parce que les monomères représentent une classe énorme de molécules, ils sont généralement classés en divers sous-groupes tels que les sucres, les alcools, les amines, les acryliques et les époxydes. Le terme "monomère" combine le préfixe mono-, qui signifie "un", et le suffixe -mer, ce qui signifie "partie".


Organisation des protéines

La structure des protéines lui permet d'accomplir diverses fonctions. Les protéines sont similaires aux glucides et aux lipides en ce qu'elles sont des polymères d'unités répétitives simples, cependant, les protéines sont beaucoup plus complexes sur le plan structurel. Contrairement aux glucides, qui ont des unités répétitives identiques, les protéines sont constituées d'acides aminés différents les uns des autres. De plus, une protéine est organisée en quatre niveaux structurels différents.

Primaire: Le premier niveau est la séquence unidimensionnelle d'acides aminés qui sont maintenus ensemble par des liaisons peptidiques. Les glucides et les lipides sont également des séquences unidimensionnelles de leurs monomères respectifs, qui peuvent être ramifiés, enroulés, fibreux ou globulaires, mais leur conformation est beaucoup plus aléatoire et n'est pas organisée par leur séquence de monomères.

Secondaire: Le deuxième niveau de structure de la protéine dépend des interactions chimiques entre les acides aminés, qui font que la protéine se replie dans une forme spécifique, telle qu'une hélice (comme un ressort enroulé) ou une feuille.

Tertiaire: Le troisième niveau de la structure des protéines est tridimensionnel. Au fur et à mesure que les différentes chaînes latérales d'acides aminés interagissent chimiquement, elles se repoussent ou s'attirent, ce qui entraîne la structure repliée. Ainsi, la séquence spécifique d'acides aminés dans une protéine dirige la protéine à se replier dans une forme organisée spécifique.

Quaternaire: Le quatrième niveau de structure est atteint lorsque des fragments de protéines appelés peptides se combinent pour former une protéine fonctionnelle plus grande. La protéine hémoglobine est un exemple de protéine qui a une structure quaternaire. Il est composé de quatre peptides qui se lient pour former un transporteur d'oxygène fonctionnel.

Une structure protéique influence également sa qualité nutritionnelle. Les grandes structures protéiques fibreuses sont plus difficiles à digérer que les petites protéines et certaines, comme la kératine, sont indigestes. Parce que la digestion de certaines protéines fibreuses est incomplète, tous les acides aminés ne sont pas absorbés et disponibles pour que le corps puisse les utiliser, diminuant ainsi leur valeur nutritionnelle.

Chiffre par OpenStax / CC BY 4.0.


Structures des protéines : primaire, secondaire, tertiaire, quaternaire

Les protéines sont la classe de molécules biologiques la plus vaste et la plus variée, et elles présentent la plus grande variété de structures. Beaucoup ont des modèles de pliage tridimensionnels complexes qui donnent une forme compacte, mais d'autres ne se replient pas du tout (protéines nativement non structurées) et existent dans des conformations aléatoires. The function of proteins depends on their structure, and defining the structure of individual proteins is a large part of modern Biochemistry and Molecular Biology.

To understand how proteins fold, we will start with the basics of structure, and progress through to structures of increasing complexity.

Liaisons peptidiques

To make a protein, amino acids are connected together by a type of amide bond called a “peptide bond”. This bond is formed between the alpha amino group of one amino acid and the carboxyl group of another in a condensation reaction. When two amino acids join, the result is called a dipeptide, three gives a tripeptide, etc. Multiple amino acids result in a polypeptide (often shortened to “peptide”).

Because water is lost in the course of creating the peptide bond, individual amino acids are referred to as “amino acid residues” once they are incorporated. Another property of peptides is polarity: the two ends are different. One end has a free amino group (called the “N-terminal”) and the other has a free carboxyl group (“C-terminal”).

In the natural course of making a protein, polypeptides are elongated by the addition of amino acids to the C-terminal end of the growing chain. Conventionally, peptides are written N-terminal first therefore gly-ser is not the same as ser-gly or GS is not the same as SG. The connection gives rise to a repeating pattern of “NCC-NCC-NCC…” atoms along the length of the molecule. This is referred to as the “backbone” of the peptide. If stretched out, the side chains of the individual residues project outwards from this backbone.

The peptide bond is written as a single bond, but it actually has some characteristics of a double bond because of the resonance between the C-O and C-N bonds:

This means that the six atoms involved are coplanar, and that there is no free rotation around the C–N axis. This constrains the flexibility of the chain and prevents some folding patterns.

Structure primaire des protéines

It is convenient to discuss protein structure in terms of four levels (primary to quaternary) of increasing complexity. Primary structure is simply the sequence of residues making up the protein. Thus primary structure involves only the covalent bonds linking residues together.

The minimum size of a protein is defined as about 50 residues smaller chains are referred to simply as peptides. So the primary structure of a small protein would consist of a sequence of 50 or so residues. Even such small proteins contain hundreds of atoms and have molecular weights of over 5000 Daltons (Da). There is no theoretical maximum size, but the largest protein so far discovered has about 30,000 residues. Since the average molecular weight of a residue is about 110 Da, that single-chain has a molecular weight of over 3 million Daltons.

Secondary Structure

This level of structure describes the local folding pattern of the polypeptide backbone and is stabilized by hydrogen bonds between N-H and C=O groups. Various types of secondary structures have been discovered, but by far the most common is the orderly repeating forms known as the a-helix and the b sheet.

An a helix, as the name implies, is a helical arrangement of a single polypeptide chain, like a coiled spring. In this conformation, the carbonyl and N-H groups are oriented parallel to the axis. Each carbonyl is linked by a hydrogen bond to the N-H of a residue located 4 residues further on in the sequence within the same chain. All C=O and N-H groups are involved in hydrogen bonds, making a fairly rigid cylinder.

The alpha helix has precise dimensions: 3.6 residues per turn, 0.54 nm per turn. The side chains project outward and contact any solvent, producing a structure something like a bottle brush or a round hair brush. An example of a protein with many a-helical structures is the keratin that makes up human hair.

The structure of a b sheet is very different from the structure of an a-helix. In a b sheet, the polypeptide chain folds back on itself so that polypeptide strands like side by side, and are held together by hydrogen bonds, forming a very rigid structure. Again, the polypeptide N-H and C=O groups form hydrogen bonds to stabilize the structure, but unlike the a-helix, these bonds are formed between neighbouring polypeptide (b) strands.

Generally, the primary structure folds back on itself in either a parallel or antiparallel arrangement, producing a parallel or antiparallel b sheet. In this arrangement, side chains project alternately upward and downward from the sheet. The major constituent of silk (silk fibroin) consists mainly of layers of b sheet stacked on top of each another.

Other types of secondary structure. While the a helix and b sheet are by far the most common types of structure, many others are possible. These include various loops, helices and irregular conformations. A single polypeptide chain may have different regions that take on different secondary structures. In fact, many proteins have a mixture of a helices, b sheets, and other types of folding patterns to form various overall shapes.

What determines whether a particular part of a sequence will fold into one or the other of these structures? A major determinant is the interactions between side chains of the residues in the polypeptide. Several factors come into play: steric hindrance between nearby large side chains, charge repulsion between nearby similarly-charged side chains, and the presence of proline.

Proline contains a ring that constrains bond angles so that it will not fit exactly into an a-helix or b sheet. Further, there is no H on one peptide bond when proline is present, so a hydrogen bond cannot form. Another major factor is the presence of other chemical groups that interact with each other. This contributes to the next level of protein structure, the tertiary structure.

Tertiary Structure

This level of structure describes how regions of secondaire structure fold together – that is, the 3D arrangement of a polypeptide chain, including a helices, b sheets, and any other loops and folds. Tertiary structure results from interactions between side chains, or between side chains and the polypeptide backbone, which are often distant in sequence. Every protein has a particular pattern of folding and these can be quite complex.

Whereas secondary structure is stabilized by H-bonding, all four “weak” forces contribute to tertiary structure. Usually, the most important force is hydrophobic interaction (or hydrophobic bonds). Polypeptide chains generally contain both hydrophobic and hydrophilic residues. Much like detergent micelles, proteins are most stable when their hydrophobic parts are buried, while hydrophilic parts are on the surface, exposed to water. Thus, more hydrophobic residues such as trp are often surrounded by other parts of the protein, excluding water, while charged residues such as asp are more often on the surface.

Other forces that contribute to tertiary structure are ionic bonds between side chains, hydrogen bonds, and van der Waals forces. These bonds are far weaker than covalent bonds, and it takes multiple interactions to stabilize a structure.

There is one covalent bond that is also involved in tertiary structure, and that is the disulfide bond that can form between cysteine residues. This bond is important only in non-cytoplasmic proteins since there are enzyme systems present in the cytoplasm to remove disulfide bonds.

Visualization of protein structures Because the 3D structures of proteins involve thousands of atoms in complex arrangements, various ways of depicting them so they are understood visually have been developed, each emphasizing a different property of the protein. Software tools have been written to depict proteins in many different ways, and have become essential to understanding protein structure and function.

Structural Domains of Proteins

Protein structure can also be described by a level of organization that is distinct from the ones we have just discussed. This organizational unit is the protein “domain,” and the concept of domains is extremely important for understanding tertiary structure. A domain is a distinct region (sequence of amino acids) of a protein, while a structural domain is an independently-folded part of a protein that folds into a stable structure. A protein may have many domains or consist only of a single domain. Larger proteins generally consist of connected structural domains. Domains are often separated by a loosely folded region and may create clefts between them..

Quaternaire Structure

Some proteins are composed of more than one polypeptide chain. In such proteins, quaternary structure refers to the number and arrangement of the individual polypeptide chains. Each polypeptide is referred to as a subunit of the protein. The same forces and bonds that create tertiary structure also hold subunits together in a stable complex to form the complete protein.

Individual chains may be identical, somewhat similar, or totally different. As examples, CAP protein is a dimer with two identical subunits, whereas hemoglobin is a tetramer containing two pairs of non-identical (but similar) subunits. It has 2 a subunits and 2 b subunits. Secreted proteins often have subunits that are held together by disulfide bonds. Examples include tetrameric antibody molecules that commonly have two larger subunits and two smaller subunits (“heavy chains” and “light chains”) connected by disulfide bonds and noncovalent forces.

In some proteins, intertwined a-helices hold subunits together these are called coiled-coils. This structure is stabilized by a hydrophobic surface on each a-helix that is created by a heptameric repeat pattern of hydrophilic/hydrophobic residues. The sequence of the protein can be represented as “ abcdefg abcdefg abcdefg …” with positions “a” and “d” filled with hydrophobic residues such as A, V, L etc. Each a-helix has a hydrophobic surface that therefore matches the other. When the two helices coil around each other, those surfaces come together, burying the hydrophobic side chains and forming a stable structure. An example of such a protein is myosin, the motor protein found in muscle that allows contraction.

Protein Folding

How and why do proteins naturally form secondary, tertiary, and quaternary structures? This question is a very active area of research and is certainly not completely understood. A folded, biologically-active protein is considered to be in its “native” state, which is generally thought to be the conformation with the least free energy.

Proteins can be unfolded or “denatured” by treatment with solvents that disrupt weak bonds. Thus organic solvents that disrupt hydrophobic interactions, high concentrations of urea or guanidine that interfere with H-bonding, extreme pH or even high temperatures, will all cause proteins to unfold. Denatured proteins have a random, flexible conformation and usually lack biological activity. Because of exposed hydrophobic groups, they often aggregate and precipitate. This is what happens when you fry an egg.

If the denaturing condition is removed, some proteins will re-fold and regain activity. This process is called “renaturation.” Therefore, all the information necessary for folding is present in the primary structure (sequence) of the protein. During renaturation, the polypeptide chain is thought to fold up into a loose globule by hydrophobic effects, after which small regions of secondary structure form into especially favorable sequences. These sequences then interact with each other to stabilize intermediate structures before the final conformation is attained.

Many proteins have great difficulty renaturing, and proteins that assist other proteins to fold are called “molecular chaperones.” They are thought to act by reversibly masking exposed hydrophobic regions to prevent aggregation during the multi-step folding process. Proteins that must cross membranes (eg. mitochondrial proteins) must stay unfolded until they reach their destination, and molecular chaperones may protect and assist during this process.

Protein families/Types of proteins

Proteins are classified in a number of ways, according to structure, function, location and/or properties. For example, many proteins combine tightly with other substances such as carbohydrates (“glycoproteins”), lipids (“lipoproteins”), or metal ions (“metalloproteins”). The diversity of proteins that form from the 20 amino acids is greatly increased by associations such as these. Proteins that are tightly bound to membranes are called “membrane proteins”. Proteins with similar activities are given functional classifications. For example, proteins that break down other proteins are called proteases.

Because almost all proteins arise by an evolutionary process, ie. new ones are derived from old ones, they can be classified into families by their relatedness. Proteins that derive from the same ancestor are called “homologous proteins”.

Studying the sequences of homologous proteins can give clues to the structure and function of the protein. Residues that are critical for function do not change on an evolutionary timescale they are referred to as “conserved residues”. Identifying such residues by comparing amino acid sequences often helps clarify what a protein is doing or how it is folded.

For example, the proteases trypsin and chymotrypsin are members of the “serine protease” family so-named because of a conserved serine residue that is essential to catalyze the reaction. Trypsin and chymotrypsin contain very similar folding patterns and reaction mechanisms. Recognizing a pattern of conserved residues in protein sequences often allows scientists to deduce the function of a protein.


Conclusion

In this study, we have demonstrated a close association between intrinsic subunit flexibility and the assembly of protein complexes. The origin of this is simple: because flexibility is largely controlled by how little surface area a protein buries intramolecularly [22], then the more flexible the protein, the more surface area that will be available to participate in intermolecular interactions. This is why increased flexibility, disorder, and conformational changes upon binding are associated with larger interfaces [16],[28],[29],[50]. The evidence presented here suggests that flexibility is particularly conducive to the formation of heterologous interfaces, in which two distinct surfaces interact with each other. Therefore, flexibility appears to facilitate the assembly of asymmetric, cyclic, and heteromeric complexes.

This work also extends our understanding of protein evolution, as it shows how the evolutionary history of a protein complex can be directly related to the flexibility of its subunits. This suggests that flexibility could potentially be quite useful in the reconstruction of protein complex evolutionary histories. To some extent, our results suggest that the eukaryotic increase in flexibility may have been driven by the evolution of protein complexes with more components. In addition, it is possible that some of the increased flexibility in eukaryotic subunits may be reflective of a greater propensity to form multiple nonconcurrent interactions, as has been seen for intrinsic disorder [49],[51],[52]. However, the increase in flexibility might also be related to selection for function other than protein complex assembly, increased tolerance due to compartmentalization and chaperones, or simply genetic drift [53].

This new knowledge of the relationship between quaternary structure topology and flexibility could aid the prediction of protein complex topologies from limited information. For example, if some knowledge of intrinsic flexibility is available (based upon sequence, structure, or experiments), this could be used to help assess the relative likelihoods of different quaternary structure arrangements. Similarly, just as flexibility appears to facilitate quaternary structure evolution, it might also prove important for engineering multiprotein assemblies, if the principles of flexibility and interactions can be harnessed to enable the packing of heterologous interfaces.

In the present study, we have interpreted our results as showing that intrinsic flexibility facilitates the assembly and evolution of quaternary structure. However, it is possible that, rather than flexibility being required for assembly, it can to an extent be thought of as arising from the physical requirements of the bound state. That is, the packing of multiple, different-shaped subunits within a single complex may necessitate flexibility. Any protein that could form sufficient intersubunit interactions might be inherently flexible in its unbound state due to a lack of intramolecular contacts. A related issue has recently been discussed by Janin and Sternberg, who suggested that many intrinsically disordered proteins are simply “proteins waiting for a partner” [54]. They propose that actual disorder should be rare in vivo, as these proteins will usually be protected by chaperones prior to assembly. Ultimately, more studies will be required to quantify the extent of in vivo flexibility and disorder, and to further disentangle the functional importance of unbound-state properties from the conformational requirements of bound subunits.