Computational Design and Engineering of de novo Biocatalysts
←
→
Page content transcription
If your browser does not render page correctly, please read the page content below
ETH Library Computational Design and Engineering of de novo Biocatalysts Doctoral Thesis Author(s): Ouald Chaib, Anissa Publication date: 2022 Permanent link: https://doi.org/10.3929/ethz-b-000536370 This page was generated automatically upon download from the ETH Zurich Research Collection. For more information, please consult the Terms of use.
DISS. ETH No. 28100 Computational Design and Engineering of de novo Biocatalysts A thesis submitted to attain the degree of DOCTOR OF SCIENCES of ETH ZURICH (Dr. sc. ETH Zurich) presented by Anissa Ouald Chaib MSc., Heinrich-Heine-University Dusseldorf born on 01.09.1992 citizen of Germany accepted at the recommendation of Prof. Dr. Donald Hilvert, Examiner Prof. Dr. Kathrin Lang, Co-Examiner 2022
Abstract Enzymes are remarkable natural catalysts. Their high efficiencies and stereoselectivities are being increasingly exploited for the sustainable synthesis of pharmaceutical, agricultural, and fine chemicals. Enzyme engineering is contributing to this development by tailoring the properties of existing enzymes and creating new ones for non-physiological reactions. Tackling the latter goal, the projects presented in this thesis have explored the potential of computational design combined with directed evolution to generate novel biocatalysts. Recent advances in computational design have made it possible to create protein scaffolds completely de novo. Chapter 2 describes efforts to equip one such protein, a de novo b-barrel, with retro-aldolase activity. Using computational design, a reactive lysine together with several supporting catalytic residues were introduced into a small binding pocket in the protein. The new Rosetta software application HBNetGen, which can design constellations of hydrogen-bonded residues, was helpful for this purpose. After engineering the scaffold for enhanced stability, the protein was produced and optimized by multiple rounds of mutagenesis and screening. The best variant, NewDesign16, catalyzed the retro-aldol cleavage of a fluorogenic substrate called methodol with a rate acceleration of 4 x 106 over background and high stereospecificity. A crystal structure of the protein showed good agreement with the original design model, providing the first example of an aldolase in a protein scaffold other than a TIM barrel. Although still less active than the best previously reported artificial aldolases, further evolution using ultrahigh-throughput droplet-based microfluidics may be possible. In Chapter 3, the family of de novo aldolases was expanded to include a computationally designed, metal-dependent helical bundle. The starting scaffold was previously optimized to catalyze ester hydrolysis and a hetero-Diels-Alder reaction. The Diels- I
Alderase DA7 was serendipitously found to have promiscuous retro-aldol activity, which was then optimized by directed evolution. The final variant efficiently catalyzes the target retro- aldol reaction with high stereospecificity and a kcat/KM value of 3880 M-1 s-1, which is approximately 8 times higher than the kcat/KM seen for the best b-barrel aldolase. Although it was not possible to crystallize the enzyme, computational modeling was used to rationalize the altered zinc coordination environment of the evolved catalyst. Moreover, docking of the substrate in the optimized pocket suggests that Tyr84 functions as the catalytic base that initiates carbon-carbon cleavage and complementing Lewis acid activation of the substrate. The functional divergence of a natural helical bundle scaffold is the topic of Chapter 4. Prokaryotic chorismate mutases (CMs) and isochorismate pyruvate lyases (IPLs) catalyze two metabolically important pericyclic reactions using the same AroQ fold and very similar binding pockets. Although clearly evolutionarily related, previous attempts to convert E. coli CM into an IPL had all failed. To shed light on the molecular determinants of IPL activity, ancestral sequences were reconstructed from homologous amino acid sequences of modern prokaryotic CMs and IPLs and characterized biochemically. While the last common ancestor, N627, only displayed CM activity, two more recent variants were found to have promiscuous CM and IPL activities. The emergence of IPL activity correlates with the replacement of an active site glutamate residue that hydrogen bonds to the hydroxyl group of chorismate in CMs with an aliphatic residue. Nevertheless, this substitution alone is not sufficient to convert a CM into an IPL, since the earliest variant containing this substitution had no IPL activity. These results highlight the subtle but important role that second and third shell residues play in establishing a particular phenotype. In Chapter 5, multiple sequence and structure alignments were exploited to identify mutations that could stabilize the VH domain of the catalytic antibody 1F7. Directed evolution experiments on the original antibody, which exhibits low chorismate mutase activity, had II
suggested that only the heavy chain variable region was needed for catalysis. However, the isolated VH domain was intractable and it was not possible to characterize it kinetically. Using the PROSS program, several VH variants were prepared and characterized. Although soluble expression of the in silico designs was still poor, one variant yielded sufficient amounts of protein and was sufficiently stable for kinetic characterization. The rate acceleration (kcat/kuncat) for the 1F7 VH enzyme was 90-fold over background, which is comparable to the original IgG. The enhanced solubility may facilitate directed evolution of this protein by genetic selection in chorismate mutase deficient E. coli strains. The projects described in this thesis have taken advantage of a range of computation- guided approaches to protein design. Although this field is still in its infancy, the results presented show the promise - as well as some of the limitations - facing this field. In the future, artificial intelligence algorithms will shed more light on enzymatic properties that need consideration for more efficient de novo design. III
Zusammenfassung Enzyme sind bemerkenswerte natürliche Katalysatoren. Ihre hohe Effizienz und Stereoselektivität werden zunehmend für die nachhaltige Synthese von pharmazeutischen, landwirtschaftlichen und chemischen Reinstoffen genutzt. Enzym Engineering trägt zu dieser Entwicklung bei, indem es die Eigenschaften bestehender Enzyme anpasst und neue Enzyme für nichtphysiologische Reaktionen entwickelt. Im Hinblick auf das letztgenannte Ziel haben, die in dieser Arbeit vorgestellten Projekte, das Potential des computergestützten Designs und der gerichteten Evolution zur Entwicklung neuartiger Biokatalysatoren untersucht. Jüngste Fortschritte im Bereich des computergestützten Designs haben es ermöglicht, Proteingerüste vollständig de novo zu erstellen. Kapitel 2 beschreibt die Bemühungen, ein solches Protein, ein de novo b-Fass, mit Retro-Aldolase-Aktivität auszustatten. Mithilfe des Computerdesigns wurde ein reaktives Lysin zusammen mit mehreren unterstützenden katalytischen Resten in eine kleine Bindungstasche des Proteins eingeführt. Die neue Rosetta- Softwareanwendung HBNetGen, die Konstellationen von wasserstoffgebundenen Resten bewerkstelligen kann, war dafür förderlich. Nach der Optimierung des Gerüsts für eine verbesserte Stabilität wurde das Protein produziert und durch mehrere Mutagenese- und Screening-Runden optimiert. Die beste Variante, NewDesign16, katalysierte die Retro-Aldol- Spaltung eines fluorogenen Substrats namens Methodol mit einer Ratenbeschleunigung von 4 x 106 gegenüber der Hintergrundreaktion und hoher Stereospezifität. Eine Kristallstruktur des Proteins zeigte eine gute Übereinstimmung mit dem ursprünglichen Entwurfsmodell und lieferte das erste Beispiel für eine Aldolase in einem anderen Proteingerüst als einem TIM- Fass. Obwohl sie immer noch weniger aktiv ist als die besten bisher bekannten unnatürlichen IV
Aldolasen, könnten weitere evolutive Verbesserungen mit Hilfe der Mikrofluidik auf Basis von Ultrahochdurchsatztröpfchen möglich sein. In Kapitel 3 wurde die Familie der de novo Aldolasen um ein computergestützt entworfenes, metallabhängiges Helixbündel erweitert. Das Ausgangsgerüst wurde zuvor für die Katalyse der Esterhydrolyse und einer Hetero-Diels-Alder-Reaktion optimiert. Bei der Diels-Alderase DA7 wurde zufällig festgestellt, dass sie eine vielseitige Retro-Aldol-Aktivität besitzt, die dann durch gerichtete Evolution optimiert wurde. Die endgültige Variante katalysiert die angestrebte Retro-Aldol-Reaktion effizient mit hoher Stereospezifität und einem kcat/KM-Wert von 3880 M-1 s-1, der etwa achtmal höher ist als der kcat/KM-Wert der besten b- Fass-Aldolase. Obwohl es nicht möglich war, das Enzym zu kristallisieren, wurde die veränderte Zink-Koordinationsumgebung des evolvierten Katalysators durch Computermodellierung rationalisiert. Darüber hinaus legt das Docking des Substrates in der optimierten Tasche nahe, dass Tyr84 als katalytische Base fungiert, die die Kohlenstoff- Kohlenstoff-Spaltung und die ergänzende Lewis-Säure-Aktivierung des Substrats einleitet. Die funktionelle Divergenz eines natürlichen Helixbündelgerüsts ist das Thema von Kapitel 4. Prokaryotische Chorismatmutasen (CMs) und Isochorismat-Pyruvat-Lyasen (IPLs) katalysieren zwei metabolisch wichtige perizyklische Reaktionen unter Verwendung derselben AroQ-Faltung und sehr ähnlicher Bindungstaschen. Obwohl sie evolutionär eindeutig verwandt sind, sind frühere Versuche, E. coli CM in eine IPL umzuwandeln, allesamt gescheitert. Um Licht in die molekularen Determinanten der IPL-Aktivität zu bringen, wurden die Vorgängersequenzen aus homologen Aminosäuresequenzen moderner prokaryotischer CMs und IPLs rekonstruiert und biochemisch charakterisiert. Während der letzte gemeinsame Vorfahre, N627, nur CM-Aktivität zeigte, wurden zwei jüngere Varianten gefunden, die sowohl CM- als auch IPL-Aktivitäten aufweisen. Das Auftreten der IPL-Aktivität korreliert mit dem Ersatz eines Glutamatrestes im aktiven Zentrum, der eine Wasserstoffbrücke zur V
Hydroxylgruppe des Chorismats durch einen aliphatischen Rest in CMs bildet. Diese Substitution allein reicht jedoch nicht aus, um ein CM in ein IPL umzuwandeln, da die früheste Variante mit dieser Substitution keine IPL-Aktivität aufweist. Diese Ergebnisse unterstreichen die subtile, aber wichtige Rolle, die zweite und dritte Schalenreste bei der Etablierung eines bestimmten Phänotyps spielen. In Kapitel 5 wurden multiple Sequenz- und Strukturabgleiche genutzt, um Mutationen zu identifizieren, die die VH-Domäne des katalytischen Antikörpers 1F7 stabilisieren könnten. Gezielte Evolutionsexperimente mit dem ursprünglichen Antikörper, der eine geringe Chorismatmutase-Aktivität aufweist, ließen vermuten, dass nur die variable Region der schweren Kette für die Katalyse erforderlich ist. Die isolierte VH-Domäne war jedoch schwer zugänglich, welche die kinetische Charakterisierung verhinderte. Mit Hilfe des PROSS- Programms wurden mehrere VH hergestellt und charakterisiert. Obwohl die lösliche Expression der in silico Entwürfe noch unzureichend war, lieferte eine Variante eine ausreichende Menge an Protein und war ausreichend stabil für die kinetische Charakterisierung. Die Ratenbeschleunigung (kcat/kuncat) für das 1F7 VH Enzym lag 90-fach über dem Hintergrundwert, was im Vergleich zum ursprünglichen IgG steht. Die gesteigerte Löslichkeit könnte die gezielte Evolution dieses Proteins durch genetische Selektion in E. coli- Stämmen mit Chorismatmutase-Defizienz erleichtern. Die in dieser Arbeit beschriebenen Projekte haben die Vorteile einer Reihe von rechnergestützten Ansätzen für das Proteindesign genutzt. Obwohl dieser Bereich noch in den Anfängen steht, zeigen die vorgestellten Ergebnisse die vielversprechenden Möglichkeiten - aber auch einige der Grenzen - dieses Bereichs. In Zukunft werden Algorithmen der künstlichen Intelligenz mehr Licht auf enzymatische Eigenschaften werfen, die für ein effizienteres de novo Design berücksichtigt werden müssen. VI
You can also read