Computational Design and Engineering of de novo Biocatalysts

Page created by Stephen Bailey
 
CONTINUE READING
ETH Library

Computational Design and
Engineering of de novo
Biocatalysts

 Doctoral Thesis

 Author(s):
 Ouald Chaib, Anissa

 Publication date:
 2022

 Permanent link:
 https://doi.org/10.3929/ethz-b-000536370

 This page was generated automatically upon download from the ETH Zurich Research Collection.
 For more information, please consult the Terms of use.
DISS. ETH No. 28100

Computational Design and Engineering of de novo Biocatalysts

              A thesis submitted to attain the degree of

             DOCTOR OF SCIENCES of ETH ZURICH

                        (Dr. sc. ETH Zurich)

                            presented by

                       Anissa Ouald Chaib

             MSc., Heinrich-Heine-University Dusseldorf

                        born on 01.09.1992

                         citizen of Germany

                accepted at the recommendation of

               Prof. Dr. Donald Hilvert, Examiner

              Prof. Dr. Kathrin Lang, Co-Examiner

                                2022
Abstract

Enzymes are remarkable natural catalysts. Their high efficiencies and stereoselectivities are

being increasingly exploited for the sustainable synthesis of pharmaceutical, agricultural, and

fine chemicals. Enzyme engineering is contributing to this development by tailoring the

properties of existing enzymes and creating new ones for non-physiological reactions. Tackling

the latter goal, the projects presented in this thesis have explored the potential of computational

design combined with directed evolution to generate novel biocatalysts.

       Recent advances in computational design have made it possible to create protein

scaffolds completely de novo. Chapter 2 describes efforts to equip one such protein, a de novo

b-barrel, with retro-aldolase activity. Using computational design, a reactive lysine together

with several supporting catalytic residues were introduced into a small binding pocket in the

protein. The new Rosetta software application HBNetGen, which can design constellations of

hydrogen-bonded residues, was helpful for this purpose. After engineering the scaffold for

enhanced stability, the protein was produced and optimized by multiple rounds of mutagenesis

and screening. The best variant, NewDesign16, catalyzed the retro-aldol cleavage of a

fluorogenic substrate called methodol with a rate acceleration of 4 x 106 over background and

high stereospecificity. A crystal structure of the protein showed good agreement with the

original design model, providing the first example of an aldolase in a protein scaffold other

than a TIM barrel. Although still less active than the best previously reported artificial

aldolases, further evolution using ultrahigh-throughput droplet-based microfluidics may be

possible.

       In Chapter 3, the family of de novo aldolases was expanded to include a

computationally designed, metal-dependent helical bundle. The starting scaffold was

previously optimized to catalyze ester hydrolysis and a hetero-Diels-Alder reaction. The Diels-

                                                                                                  I
Alderase DA7 was serendipitously found to have promiscuous retro-aldol activity, which was

then optimized by directed evolution. The final variant efficiently catalyzes the target retro-

aldol reaction with high stereospecificity and a kcat/KM value of 3880 M-1 s-1, which is

approximately 8 times higher than the kcat/KM seen for the best b-barrel aldolase. Although it

was not possible to crystallize the enzyme, computational modeling was used to rationalize the

altered zinc coordination environment of the evolved catalyst. Moreover, docking of the

substrate in the optimized pocket suggests that Tyr84 functions as the catalytic base that

initiates carbon-carbon cleavage and complementing Lewis acid activation of the substrate.

       The functional divergence of a natural helical bundle scaffold is the topic of Chapter 4.

Prokaryotic chorismate mutases (CMs) and isochorismate pyruvate lyases (IPLs) catalyze two

metabolically important pericyclic reactions using the same AroQ fold and very similar binding

pockets. Although clearly evolutionarily related, previous attempts to convert E. coli CM into

an IPL had all failed. To shed light on the molecular determinants of IPL activity, ancestral

sequences were reconstructed from homologous amino acid sequences of modern prokaryotic

CMs and IPLs and characterized biochemically. While the last common ancestor, N627, only

displayed CM activity, two more recent variants were found to have promiscuous CM and IPL

activities. The emergence of IPL activity correlates with the replacement of an active site

glutamate residue that hydrogen bonds to the hydroxyl group of chorismate in CMs with an

aliphatic residue. Nevertheless, this substitution alone is not sufficient to convert a CM into an

IPL, since the earliest variant containing this substitution had no IPL activity. These results

highlight the subtle but important role that second and third shell residues play in establishing

a particular phenotype.

       In Chapter 5, multiple sequence and structure alignments were exploited to identify

mutations that could stabilize the VH domain of the catalytic antibody 1F7. Directed evolution

experiments on the original antibody, which exhibits low chorismate mutase activity, had

                                                                                                II
suggested that only the heavy chain variable region was needed for catalysis. However, the

isolated VH domain was intractable and it was not possible to characterize it kinetically. Using

the PROSS program, several VH variants were prepared and characterized. Although soluble

expression of the in silico designs was still poor, one variant yielded sufficient amounts of

protein and was sufficiently stable for kinetic characterization. The rate acceleration (kcat/kuncat)

for the 1F7 VH enzyme was 90-fold over background, which is comparable to the original IgG.

The enhanced solubility may facilitate directed evolution of this protein by genetic selection in

chorismate mutase deficient E. coli strains.

        The projects described in this thesis have taken advantage of a range of computation-

guided approaches to protein design. Although this field is still in its infancy, the results

presented show the promise - as well as some of the limitations - facing this field. In the future,

artificial intelligence algorithms will shed more light on enzymatic properties that need

consideration for more efficient de novo design.

                                                                                                  III
Zusammenfassung

Enzyme sind bemerkenswerte natürliche Katalysatoren. Ihre hohe Effizienz und

Stereoselektivität werden zunehmend für die nachhaltige Synthese von pharmazeutischen,

landwirtschaftlichen und chemischen Reinstoffen genutzt. Enzym Engineering trägt zu dieser

Entwicklung bei, indem es die Eigenschaften bestehender Enzyme anpasst und neue Enzyme

für nichtphysiologische Reaktionen entwickelt. Im Hinblick auf das letztgenannte Ziel haben,

die in dieser Arbeit vorgestellten Projekte, das Potential des computergestützten Designs und

der gerichteten Evolution zur Entwicklung neuartiger Biokatalysatoren untersucht.

       Jüngste Fortschritte im Bereich des computergestützten Designs haben es ermöglicht,

Proteingerüste vollständig de novo zu erstellen. Kapitel 2 beschreibt die Bemühungen, ein

solches Protein, ein de novo b-Fass, mit Retro-Aldolase-Aktivität auszustatten. Mithilfe des

Computerdesigns wurde ein reaktives Lysin zusammen mit mehreren unterstützenden

katalytischen Resten in eine kleine Bindungstasche des Proteins eingeführt. Die neue Rosetta-

Softwareanwendung HBNetGen, die Konstellationen von wasserstoffgebundenen Resten

bewerkstelligen kann, war dafür förderlich. Nach der Optimierung des Gerüsts für eine

verbesserte Stabilität wurde das Protein produziert und durch mehrere Mutagenese- und

Screening-Runden optimiert. Die beste Variante, NewDesign16, katalysierte die Retro-Aldol-

Spaltung eines fluorogenen Substrats namens Methodol mit einer Ratenbeschleunigung von

4 x 106 gegenüber der Hintergrundreaktion und hoher Stereospezifität. Eine Kristallstruktur

des Proteins zeigte eine gute Übereinstimmung mit dem ursprünglichen Entwurfsmodell und

lieferte das erste Beispiel für eine Aldolase in einem anderen Proteingerüst als einem TIM-

Fass. Obwohl sie immer noch weniger aktiv ist als die besten bisher bekannten unnatürlichen

                                                                                          IV
Aldolasen, könnten weitere evolutive Verbesserungen mit Hilfe der Mikrofluidik auf Basis von

Ultrahochdurchsatztröpfchen möglich sein.

       In Kapitel 3 wurde die Familie der de novo Aldolasen um ein computergestützt

entworfenes, metallabhängiges Helixbündel erweitert. Das Ausgangsgerüst wurde zuvor für

die Katalyse der Esterhydrolyse und einer Hetero-Diels-Alder-Reaktion optimiert. Bei der

Diels-Alderase DA7 wurde zufällig festgestellt, dass sie eine vielseitige Retro-Aldol-Aktivität

besitzt, die dann durch gerichtete Evolution optimiert wurde. Die endgültige Variante

katalysiert die angestrebte Retro-Aldol-Reaktion effizient mit hoher Stereospezifität und einem

kcat/KM-Wert von 3880 M-1 s-1, der etwa achtmal höher ist als der kcat/KM-Wert der besten b-

Fass-Aldolase. Obwohl es nicht möglich war, das Enzym zu kristallisieren, wurde die

veränderte    Zink-Koordinationsumgebung         des     evolvierten    Katalysators     durch

Computermodellierung rationalisiert. Darüber hinaus legt das Docking des Substrates in der

optimierten Tasche nahe, dass Tyr84 als katalytische Base fungiert, die die Kohlenstoff-

Kohlenstoff-Spaltung und die ergänzende Lewis-Säure-Aktivierung des Substrats einleitet.

       Die funktionelle Divergenz eines natürlichen Helixbündelgerüsts ist das Thema von

Kapitel 4. Prokaryotische Chorismatmutasen (CMs) und Isochorismat-Pyruvat-Lyasen (IPLs)

katalysieren zwei metabolisch wichtige perizyklische Reaktionen unter Verwendung derselben

AroQ-Faltung und sehr ähnlicher Bindungstaschen. Obwohl sie evolutionär eindeutig

verwandt sind, sind frühere Versuche, E. coli CM in eine IPL umzuwandeln, allesamt

gescheitert. Um Licht in die molekularen Determinanten der IPL-Aktivität zu bringen, wurden

die Vorgängersequenzen aus homologen Aminosäuresequenzen moderner prokaryotischer

CMs und IPLs rekonstruiert und biochemisch charakterisiert. Während der letzte gemeinsame

Vorfahre, N627, nur CM-Aktivität zeigte, wurden zwei jüngere Varianten gefunden, die

sowohl CM- als auch IPL-Aktivitäten aufweisen. Das Auftreten der IPL-Aktivität korreliert

mit dem Ersatz eines Glutamatrestes im aktiven Zentrum, der eine Wasserstoffbrücke zur

                                                                                             V
Hydroxylgruppe des Chorismats durch einen aliphatischen Rest in CMs bildet. Diese

Substitution allein reicht jedoch nicht aus, um ein CM in ein IPL umzuwandeln, da die früheste

Variante mit dieser Substitution keine IPL-Aktivität aufweist. Diese Ergebnisse unterstreichen

die subtile, aber wichtige Rolle, die zweite und dritte Schalenreste bei der Etablierung eines

bestimmten Phänotyps spielen.

       In Kapitel 5 wurden multiple Sequenz- und Strukturabgleiche genutzt, um Mutationen

zu identifizieren, die die VH-Domäne des katalytischen Antikörpers 1F7 stabilisieren könnten.

Gezielte Evolutionsexperimente mit dem ursprünglichen Antikörper, der eine geringe

Chorismatmutase-Aktivität aufweist, ließen vermuten, dass nur die variable Region der

schweren Kette für die Katalyse erforderlich ist. Die isolierte VH-Domäne war jedoch schwer

zugänglich, welche die kinetische Charakterisierung verhinderte. Mit Hilfe des PROSS-

Programms wurden mehrere VH hergestellt und charakterisiert. Obwohl die lösliche

Expression der in silico Entwürfe noch unzureichend war, lieferte eine Variante eine

ausreichende Menge an Protein und war ausreichend stabil für die kinetische

Charakterisierung. Die Ratenbeschleunigung (kcat/kuncat) für das 1F7 VH Enzym lag 90-fach

über dem Hintergrundwert, was im Vergleich zum ursprünglichen IgG steht. Die gesteigerte

Löslichkeit könnte die gezielte Evolution dieses Proteins durch genetische Selektion in E. coli-

Stämmen mit Chorismatmutase-Defizienz erleichtern.

    Die in dieser Arbeit beschriebenen Projekte haben die Vorteile einer Reihe von

rechnergestützten Ansätzen für das Proteindesign genutzt. Obwohl dieser Bereich noch in den

Anfängen steht, zeigen die vorgestellten Ergebnisse die vielversprechenden Möglichkeiten -

aber auch einige der Grenzen - dieses Bereichs. In Zukunft werden Algorithmen der

künstlichen Intelligenz mehr Licht auf enzymatische Eigenschaften werfen, die für ein

effizienteres de novo Design berücksichtigt werden müssen.

                                                                                             VI
You can also read