\r\n\r\n
CDSとORFの決定的な違いは、CDSがタンパク質に翻訳される遺伝子の実際の塩基配列であるのに対し、ORFは翻訳開始点(開始コドン)から翻訳終了点(停止コドン)までのDNA配列である点である。
遺伝子には、コード配列(CDS)があります。遺伝子の全エクソンと、開始コドン、停止コドンからなる。実際に遺伝子が翻訳され、タンパク質を生成する部分である。オープンリーディングフレームは、開始コドンと停止コドンの間にある塩基配列のことである。ORFには、遺伝暗号の翻訳を中断するためのストップコドンがない。原核生物では、遺伝子のCDSとORFは同一である。
1. 概要と主な相違点 2. CDとは 3. ORFとは 4. CDSとORFの類似点 5. 横並び比較 - 表形式でのCDSとORF 6. まとめ
CDS(コーディング配列)は、遺伝子の中で実際にタンパク質に翻訳される部分である。cdsはエクソンとAUGコドン、ストップコドンの2つのコドンから構成され、5'UTRと3 "UTRという2つの非翻訳領域を含まない。
図01:符号化シーケンス
コーディング配列は、個人のゲノム全体と比較すると非常に小さな部分である。コーディング配列は、タンパク質のアミノ酸配列を構成するのに必要な塩基配列で構成されています。したがってCDSは、ヌクレオチドの3連符やコドンに分割できる凝縮されたエクソンである。コドンはアミノ酸を生成する。
オープンリーディングフレーム(ORF)とは、開始コドンから停止コドンまでの連続したヌクレオチド配列の延長のことである。簡単に言うと、ORFは開始コドンと停止コドンの間にある塩基配列の領域である。開始コドンと停止コドンの間の塩基配列は、アミノ酸をコードしています。一般に、開始コドンはATG、停止コドンはTAG、TAA、TGAである。 ORFは、転写および翻訳の際に機能的なタンパク質を提供する。このように、ORFは開始コドン、中間領域のいくつかのコドン、停止コドンから構成されています。興味深いことに、ORFの長さは3で割ることができる。
図02:読書ボックスを開く
原核生物ではイントロンが存在しないため、ORFは直接mRNAに転写される遺伝子のコード配列となる。したがって、原核生物ではCDSとPRFは同一である。原核生物の遺伝子を探す場合、ORFを探し、原核生物の遺伝子の位置を特定することは容易である。真核生物ではイントロンが存在するため、ORFはコドンの配列が処理されたりRNAスプライシングされたものである。 ORFが遺伝子の一部であると考えられる場合には、遺伝子予測のための有用な証拠となる。
CDSはタンパク質に変換される遺伝子の実際の部分、ORFは開始コドンから停止コドンまでのDNAの延長線上の部分である。これが、CDSとORFの決定的な違いなんですね。また、CDSはイントロンを含まないが、ORFはイントロンを含むことがある。cDSは完全なmRNA配列に転写されるが、ORFはmRNA配列の一部であることがある。したがって、この点もCDSとORFの違いである。
以下のインフォグラフィックで、CDとORFの違いを一覧にしています。
CDSとORFは遺伝子の2つの重要な構成要素です。CDSはタンパク質に変換されるDNAの実際の領域を指し、ORFは開始コドンATGで始まり3つの停止コドン(TAA、TAG、TGA)のいずれかで終了するDNA配列です。しかし、遺伝子のコード配列は、完全なmRNA配列に転写される。CDSはすべてORFであるが、ORFはすべてCDSではないので、この記事ではCDSとORFの違いについてまとめている。
1 "Open Reading Framework", Wikipedia, Wikimedia Foundation, 27 November 2020, available here.