酵母S. cerevisiaeの遺伝子発現に強く影響するKozak配列の上流ヌクレオチド｜生物工学ジャーナル

我々はよく研究されている酵母CYC1プロモーターの5分-UTRを選びました。 pCYC1min（-143位から）と酵母強化型緑色蛍光タンパク質（yEGFP）およびCYC1ターミネーターを融合させた。完全なCYC1プロモーターと比較して、pCYC1minは3つのTATAボックスのうち2つを含み、上流の活性化配列を持たない。pCYC1minは適度に弱いプロモーターで、このため、リーダー配列の点変異が下流のレポータータンパク質の発現に与える正負両方の影響を検出する理想的な候補と思われた。 CYC1プロモーター5′-UTRは71ヌクレオチド長である。

以下の解析では、CYC1 5′-UTRの-1〜-8位の部分を拡張Kozak配列、-9〜-15位の部分を上流領域と呼ぶことにした。拡張コザック配列ではアデニンが5カ所で強く保存されているが、上流領域ではどのヌクレオチドも強く保存されていない。しかし、ほぼ全ての部位でアデニンが最も多く保存されている（背景参照）。

拡張Kozak配列
グアニンへの多重変異
上流領域
計算機解析

拡張Kozak配列

CYC1の-15位から-1位の元の配列はCACACTAAATTAATA（以下k 0）である。 Dvirらによれば、-1、-3、-4位にアデニンがあり、-2位にグアニンがないことから、このリーダー配列は高発現にほぼ最適であるはずである。しかし、-2位のチミンと-13位のシトシンは、高発現するセレビシエ遺伝子の中で、それぞれ20 %と10 %以下の頻度である。 k 1の蛍光レベルはk 0の蛍光レベルより6.5 %高かったが、この2つのリーダー配列のデータから統計的に有意な差は見られなかった（p値=0.13）。 k 1（最適化されたリーダー配列）を次の合成コンストラクトのテンプレートとして保持し、k 1の単一または複数のヌクレオチドを変異させることにより、さらに57の合成5′-UTRを構築した。したがって、拡張コザック配列のみを改変し、一方、上流領域は-9位から-15位にアデニンを有する高い遺伝子発現に最適な構成に保たれた。

Table 1 k1からk25までの合成CYC1 5′-UTR terminal sequences

最高の蛍光はk16（-5位のアデニンをグアニンが置換）で、最低はk9（-3位のアデニンをチミンが置換）までに記録されていた。さらに、k 16の蛍光レベルは、k 0およびk 1の蛍光レベルと統計的に有意な差があった。グアニンは酵母のリーダー配列では最も頻度の低いヌクレオチドであるため、-5位のグアニンによる蛍光の増強は驚くべき結果であった。さらに、Dvirらの研究でも、この位置にグアニンが検出されることはなく、蛍光の増強も見られなかった。

k1との統計的有意差がないにもかかわらず、k16以外でk1の蛍光レベルを>5 %増加させた構築物は、k3、k10、k24だけである。特に、k 3では、-1位のアデニンがチミンに置換されており、k 10では、-3位のアデニンがグアニンに変異していた。先に報告したように、-1位と-3位のアデニンは高い遺伝子発現を保証するはずである。しかし、このようなアデニンのバックグラウンドで、さらに遺伝子発現を高めるには、-1位や-3位のヌクレオチドの頻度が低いことが必要であると思われる。一方、-3位（k9）のアデニンの代わりにチミンを導入した変異は、k1の蛍光レベルを>5 %減少させる唯一のものであった。この結果は、-3位のチミンが発現量の少ない遺伝子に多いという観測と一致する（図1 a）。

k0に関しては、25の新しい合成リーダー配列すべてに6〜8の変異が含まれていた。 k 9を除いて、すべての合成5′-UTRはk 0より高い蛍光レベルを示し、そのうちの5つは有意に高かった。その中には、-1, -4, -5の位置が含まれている。 k 1との比較ですでに述べたように、開始コドンのすぐ上流にあるアデニンは、遺伝子発現に特に有利ではないようであった。ここで、シトシン、チミン（それぞれk2、k3）はアデニンよりはるかに優れた性能を示した。しかし、k 0に関しては、上流にさらに7つの点突然変異があった。 4位ではチミン（k12）が最も蛍光を増加させ、5位ではシトシン（k14）とグアニン（k16）の両方がk0よりも>10 %まで蛍光を増加させた。 k 0は-2, -5, -6位にチミンがあるので、k 0との統計的に有意な差を示した5つの合成5′-UTRは、それぞれ2つ以上の隣接する部位で点変異の影響を受けていた。さらに3つの合成リーダー配列（k 10、k 17、k 24）は、k 0と比較して>10 %の蛍光増加を起こしたが、これらの差は有意ではなかった（p値 >0.05）。k 10とk 17も隣接部位に2点変異があった（図1 b）。

グアニンへの多重変異

最初の25個の合成5′-UTR配列の分析から、グアニンへの一点変異（これは高発現S. cerevisiae遺伝子の拡張コザック配列には基本的に存在しない）が、遺伝子発現に最適なリーダー配列であるk 1の蛍光レベルを高めるという驚くべき結果が得られました。さらに、我々の合成5′-UTRのうち5つは明確に（>9 %）pCYC1minの蛍光レベルを増加させた。

我々のデータによると、グアニンへの単一の変異が遺伝子発現を促進する。しかし、過去の2つの論文では、STARTコドンの前に複数のグアニンが配置されると、タンパク質合成がかなり低下することが報告されている。そこで、グアニンへの複数の点変異がpCYC1minの翻訳効率にどのような影響を与えるかを評価し、遺伝子発現の調節に利用できるかどうかを検討した。

によると、高発現のS. cerevisiae遺伝子のうち、-1位から-15位の間ではグアニンが最も頻度の低い塩基で、-7位の場合は例外で最も頻度が低い塩基がシトシンとなる。この配列を反映した合成5′-UTRを構築した（k26；表2）。この結果、陰性対照（yEGFP遺伝子を含まないS. cerevisiae株）と対応する蛍光レベルに有意差がない（p値=0.21）ことから、遺伝子発現を停止させることができた。

表2 k26からk38までの合成CYC1 5′-UTR末端配列

拡張コザック配列全体（k27）または上流領域（k28）を覆う場合、グアニン（-7位のシトシン）への複数の変異は異なる形で遺伝子発現に影響するかどうかを検証した。変異はk1に対して行われたので、変異のない部位はすべてアデニンを含んでいた。驚くべきことに、この2つの構成は遺伝子発現に関して同等であり（p値>0.40）、k 1の蛍光レベルは約半分に減少することがわかった。

k27から始めて、-1位（k29）、-2位（k30）、-3位（k31）のグアニンをアデニンに置換し、拡張Kozak配列の他の部位がグアニンかシトシンで占有されている場合に、スタートコドン直上3位にアデニン1つがあれば蛍光発現を増強できるかどうかを検討した。 1位のアデニンは、k27の蛍光を全く改善しなかった。興味深いことに、-2, -3 の位置では、アデニンは k 1 の蛍光レベルの約 7 %まで遺伝子発現を低下させた。これらの結果は、アデニンが-3位や-1位を占めたとしても、それ自体では遺伝子発現を向上させることができないことを示している。さらに一般的には、リーダー配列の一点変異が遺伝子発現に及ぼす影響は、文脈に強く依存すると結論できる。

最後に、上流領域が遺伝子発現にどれほど重要かをより理解するために、グアニンの数を7（k 28）から1（k 38）に徐々に減らしていった。 9位から始めて、各段階でグアニンをアデニンに置き換えていき、アデニンの数に応じて蛍光レベルがほぼ直線的に増加することを確認した（図2、Additional file 1）。 k 1と蛍光レベルが統計的に有意に異なる最後の配列はk 36で、この配列では-13位から-15位にグアニンが存在していた。 15 位のグアニンだけでも、14 位のグアニンを伴っていても、k 1 の蛍光レベルとの有意な差は生じなかった。したがって、高発現に最適化された拡張コザック配列が存在する場合でも、上流領域の複数の変異はタンパク質合成に明らかな影響を与え、タンパク質量を調整する手段として利用できることがわかった。この結果の説明は、後述の計算機解析のセクションに記載されている。興味深いことに、上流領域でアデニンと混在する4つのグアニン（k33）は、4つ並んだグアニン（k32）よりもk1蛍光を小さくし、5′-UTR内部の点突然変異の遺伝子発現への影響がヌクレオチドの状況に大きく依存することをさらに確認した（Fig. 2; k 0蛍光との比較はAdditional file 1を参照）。

上流領域

これまでの解析により、5′-UTR内の単一および複数の変異による遺伝子発現への影響が強く文脈依存的であることが確認された。さらに、コザック配列だけでなく上流領域内部の変化も遺伝子発現に顕著な影響を与えることが、今回のデータから明確になった。そこで、アデニンとは異なる1塩基を上流領域に置いたときに翻訳速度が変わるかどうかを評価するために、-9位から-15位までのk 1に点変異を施した（表3）

表3 k 39からk 58までの合成CYC1 5′-UTR terminal sequences

すべての点変異（k 38の1つは除きます）はk 1に関するよりも蛍光レベルが高くなる結果となりました。注目すべきは、8つのケースで、蛍光の増加は統計的に有意であった（>k 1の蛍光より10 %高い）ことである。これらの8つの変異は、-11から-14までの4つの連続した位置を含んでいた。これらはいずれもDvirらによる参考文献には考慮されていなかった。 .

位置-11において、アデニンの代わりにグアニンがあると（k 47）蛍光発現が>15 %増加し、一方シトシンおよびチミンは有意な影響を与えなかった。 12位の変異はいずれもk 1の蛍光を増加させた。最も大きな変化（>15 %）はグアニン（k 50）によるものであった。 13位の変異もまたk 1の蛍光レベルを強く増加させた。 2つの点変異、シトシン（k51）とグアニン（k53）は、k1からの蛍光に統計的に有意な差をもたらしたが、チミン（k52）はk1の蛍光を約14 %増大させたが、これは統計的有意差には達しなかった。 58 個の合成 5′-UTR のうち、k 51 の蛍光レベルが最も高く、k 1 の蛍光レベルよりも約 17 % 高かったことに注目すべきである。 3; k 0との比較はAdditional file 1参照）。

上流領域のこの最後の解析結果は、別の驚くべき結果を強調している：Kozak配列上流の一点変異、特に-12と-13位置は、アデニンが多い文脈から最も遺伝子発現を増強するものであった。

計算機解析

計算されたmRNA二次構造とそれに対応する最小自由エネルギー（MFE）、および測定された蛍光レベルとの相関を調べるためにRNAfoldによるシミュレーションを実施しました。その結果、-15…-1領域のアデニンからグアニン（およびシトシン）への多重変異による蛍光の低下を説明することができた。一方、RNAfoldを用いたシミュレーションでは、一点変異が翻訳効率に及ぼす影響について、もっともらしい正当な理由は得られなかった。

RNAfoldの入力として、pCYC1minの転写開始点から始まりCYC1ターミネーターのポリA部位で終わるmRNAの配列を用いた。各配列は937ヌクレオチド長である。予備的なシミュレーションの結果、150-200ヌクレオチドの可変長のポリA鎖は、mRNAのフォールディングに大きな影響を与えないことが確認されました。 mRNAの二次構造はすべて30℃（FACS実験のためにS. cerevisiae細胞を培養した温度）で計算されました。これは、今回分析した59の配列の中で最も高く、最も一般的なものである（追加ファイル1参照）。このMFEに対応するmRNAの二次構造は、-40位と+10位の間に巨大なヘアピンが存在することが特徴である。ヘアピンループは-31位から+1位まで続いており、今回対象とした5′-UTR部分全体を含んでいる。ヘアピン幹は9つの塩基対でできており、そのうち1つだけが-38位と+8位にアデニンがあるため「ミスマッチ」を起こした（図4 a参照）

上流領域または拡張Kozak配列のいずれかのグアニンへの複数の変異は、少なくとも-15…-1領域の一部とCDS（yEGFP）またはCYC1ターミネーターの間で塩基対相互作用を引き起こす。その結果、巨大ヘアピンは破壊され、mRNA二次構造のMFEを低下させる1本または2本のステムで置換される（表2）。 241.21 kcal/molより小さいMFE値のほとんどは、k 1の蛍光レベルより低いものであった（図5）。この結果は、5′-UTRの安定なmRNA二次構造がタンパク質の発現を低下させるという概念と一致している（supported by , ）。しかし、測定された蛍光レベルは、MFE の増加に比例して増加することはなかった。さらに、2つのケース（k 32とk 36）では、RNAfoldはmRNAの構造で巨大なヘアピンを予測したが、我々の実験からの蛍光レベルはk 1のそれよりも著しく低かった（図5および追加ファイル1）

k 26は、高発現S. cerevisiae遺伝子群の中から-15位と-1位の間で最も頻度の少ないヌクレオチドを選択して設計したものである。その結果、MFE（-261.39 kcal/mol）は、本研究で検討した転写ユニットのアンサンブルの中で最も低い値であった。 MFE mRNAの二次構造には、-15…-1領域が2つの異なるステムに隔離されているため、巨大なヘアピンは存在しない。 1位と-6位の間のグアニンは長いステムの一部であり、yEGFP配列の最初（+33位から+38位）の6量体と対になっていた。一方、-9位から-15位はCYC1ターミネーターの領域（+750から+758位）と対になっていた（図4 b）。

k30とk31ではk26のちょうど上の蛍光レベルが登録されていた。両者とも上流領域（7つのアデニンでできている）と拡張コザック領域（それぞれ-2位と-3位）にアデニンがあることがk 26と異なっていた。 k 26と同様に、k 30の拡張Kozak領域の最初の5ヌクレオチドとk 31の最初の6ヌクレオチドは、CDSとともにステムに隔離されていた。しかし、k26とは異なり、k30とk31の上流領域はペアリングの相互作用が全くなかった（図4 b参照）。また、それらのMFE（それぞれ-244.28および-247.26 kcal/mol）は、k26のMFEよりも著しく高い値であった。これらの3つの配列から、タンパク質の発現を著しく低下させる条件として、-1位から-5位のヌクレオチドをmRNAの二次構造で囲い込むことが必要であることが示唆された。さらに、これらのヌクレオチドのすべてが塩基対相互作用に関与している必要はない。実際、-1位（k30）または-2位（k26とk31）のグアニンは「自由」であり、mRNA構造におけるミニループの存在に関与している

しかし、この仮説はk29によって矛盾している。この配列のMFE（-245.97 kcal/mol）はk30およびk31のそれと同等であり、対応するmRNA二次構造はk31のそれと非常に似ている（図6 a）。それにもかかわらず、k 29に関連する蛍光レベルはk 31のそれよりも6倍以上高く、k 1のそれの45％に達した。しかし、両者のmRNAの二次構造は似て非なるものである。 k27では、拡張コザック配列はCYC1ターミネーターとの塩基対相互作用に関与しているが、k29では拡張コザック配列はCDSとのステムにロックされている。 k 27 の MFE は k 29 よりも低いが、2 つの配列の蛍光レベルに差はない（p 値 =0.20）。 b 上流領域の複数のグアニンは、5′-UTR と CYC1 ターミネーターの間の塩基対相互作用によって特徴づけられる mRNA 構造を生み出す。このためMFEが高くなり、結果として蛍光も高くなる

k 27はk 29- k 31と同様に上流がアデニンのみで構成された領域であることがわかった。しかし、これら3つの配列とは異なり、k 27の拡張Kozak配列にはアデニンが含まれていなかった。 k 27のMFE（-247.04 kcal/mol）はk 29- k 31と同等であったが、対応するmRNAの二次構造は異なる配置であった。実際、拡張コザック配列のすべてのヌクレオチド（-7位のシトシンを除く）は、CDSではなくCYC1ターミネーター（+755から+762位；図6 a）と塩基対の相互作用に関与していることが確認された。 k27の蛍光レベルはk29のそれよりもわずかに高く、すなわちk31のそれよりもほぼ7倍大きかった。

これまでに検討した5つの配列（k26、k27、k29〜k31）は、MFE mRNA二次構造中のステムに隔離されているグアニンに富む拡張コザック領域を共通に持っていた。 4つのケースでは、拡張コザック配列はCDSと（部分的に）対になっており、1つのケース（k 27）ではCYC1ターミネーターと対になっていた。 k 26のMFEは、その上流領域もステムに隔離されていたため、最も低い値であった。他の4つの配列は非常に似たMFE値を示したが、蛍光レベルはむしろ異なっていた。

k1に関して複数の変異の影響を受けた他の配列群は、拡張コザック配列ではアデニンのみで、上流領域では可変数のグアニンを持っていた。

k 28、k 34、k 35はそれぞれ-15位置から下流に向かって7、6、5グアニンが一列に並んだ配列であった。 k 35のMFEはk 28やk 34のそれよりも明らかに高かったが（表2）、3つの配列は、上流領域の少なくとも5つのグアニン（および下流の最初のアデニン）がCYC1ターミネーターとの塩基対形成相互作用によりステムに固定された類似のmRNA構造を生じた（図6 b参照）

興味深いことに、k 28のMFEと蛍光レベルの両方はk 27とk 29と同等であった。したがって、コザック配列にペアリング相互作用がなくても、上流領域がステムに隔離されるだけで、タンパク質の発現が明らかに低下することが保証されたのである。

異なるMFE mRNA二次構造がK33（グアニン4個、アデニン混在）で得られた。この場合、拡張Kozak配列の半分と上流領域のほぼ全体がCDSと塩基対形成反応を起こし、長いステムを形成した。しかし、上流領域の5塩基だけがCYC1ターミネーターとステムにロックされたk 35と比較すると、k 33は高いMFEを示すとともに、高い蛍光レベルを示した（図5および追加ファイル1）

最後に、k 32、k 36、k 37（上流領域にそれぞれ4、3、2個のグアニンを持つ）については、RNAfoldはk 1と同じMFEを返した。また、対応するmRNAの二次構造は、いずれも巨大ヘアピンの存在によって特徴づけられた（Additional file 1参照）。私たちの実験データと比較すると、この結果はk37についてだけもっともらしいが、k32とk36の測定結果とは明らかに不一致であり、それらの蛍光レベルはk1のそれよりも著しく低かった(Fig. 5)。特に、32番の蛍光は1番の蛍光の約69%にしか相当しなかった。このことから、in silico simulationで示唆されたように、in vivoではk 32とk 1は同じMFEとmRNAの二次構造を共有していると言える。 k4は-1位にグアニンを持ち、-31位のシトシンと対になってループの長さが32から29ヌクレオチドに減少し、MFEは-241.42 kcal/molに低下した（図4 a）。我々のデータによると、この最小限の変化は蛍光発現に影響を及ぼさない。 k 1よりも有意に高い蛍光レベルを誘導した他の点変異（すなわち、k 16、k 47- k 51、およびk 53- k 55）はすべて、RNAfoldシミュレーションによると、k 1と同じMFEおよび対応するmRNA二次構造によって特徴づけられた

。

Nucleotides upstream of Kozak sequence strongly affects gene expression in the yeast S. cerevisiae

拡張Kozak配列

グアニンへの多重変異

上流領域

計算機解析

コメントを残すコメントをキャンセル

拡張Kozak配列

グアニンへの多重変異

上流領域

計算機解析

コメントを残す コメントをキャンセル

コメントを残すコメントをキャンセル