遺伝子の記述方法:大文字 小文字 イタリック

遺伝子の名前が大文字小文字でここにいらっしゃる方が意外に多いので高校生物と実際の遺伝学とのギャップを念頭に少々説明致します。

原則

混乱の原因


■遺伝子を記述する共通の原則

(微生物を除く、例外はあり)

●遺伝子記号はローマ字、若しくはローマ字と数字

α、βも使えないので、a, bになります。例: Ppar alpha → Ppara。数字はI, II, III は使えず、1, 2, 3 です。和訳はダメです。

●遺伝子(DNA, mRNA)はイタリック(斜体)で表記、タンパク質は正体

(例外有り↓)。
"gene"という単語の提唱者ウィルヘルム・ヨハンセン (Wilhelm Ludwig Johannsen デンマークの植物学者) が記述した頃にはすでにイタリックでした。
彼はgenotype (遺伝子型), phenotype(表現型)の言葉も提唱していおり、これらもイタリックで記載していました。
学名にせよ遺伝子にせよイタリックは強調表示であり字体を変えることが重要だったようです。 遺伝子命名規約でも生物によってはイタリックは必ずしも義務ではなく推奨です。
手書きの場合はイタリックの代わりに下線をつけます: gene
電子メールなどプレーンテキストではアンダーバーで挟みます:_gene_ 
イタリックは遺伝子・タンパク質の区別だけでなく、ClockPeriod などが「一般的な単語」か「遺伝子」かを区別するのにも役立ちます。イタリックのClock gene は1つの遺伝子ですが、プレーンフォントの Clock geneは一般的な「時計遺伝子」とわかります(それでもけっこう紛らわしいです)。

●劣性アリルは小文字で、 優性アリルは大文字で始まる

ハエ・マウスではアリルは肩書きにしますが、便宜的にアリルを遺伝子記号のように扱う場合もあります。
ハエの遺伝子名は最初に取れた変異体が優性なら大文字、劣性なら小文字で始まります。遺伝子の命名時に変異体が無ければ大文字で始まります。
タンパク質は全て大文字にすることが規定されている生物が多いようです。
例: GeneDominant , Generecessive, PROTEIN
※ 動物の遺伝子記号は大文字小文字の変化はしません。
例:y w/y w; cn1/cn+; Sb1/Sb+
キイロショウジョウバエの例。
第一染色体; 第二染色体; 第三染色体。
+は野生型アリル。Sb+な ど正常アリルや染色体は単純に「+」とも略す。
yellow, white のアリルは省略。
※植物ではアリルの優勢劣勢にしたがって、遺伝子記号の大文字小文字が変化します。
例:C1 Bz1/c1 bz1 (同じ染色体に乗った遺伝子)

●ヘテロ接合体の遺伝子型はスラッシュで区切る(必要ならホモ接合体も同様)

例: ヘテロ接合体 geneA/genea  ホモ接合体 genea/genea
パンネットの方形。
ヒト血液型の一例。
父(AO)の配偶子
A O
母(BO)の配偶子 B AB BO
O AO OO
配偶子の出現割合(1/2)は省略してある。
A, B, Oは遺伝子記号ではない。

Aa, aaのような表記は、パンネットの方形(パネットスクエア, Punnett square)の影響でしょう。 これはメンデル遺伝を分かり易くするために、 Reginald C. Punnett博士が提案したすばらしいモデルです。 伝統的に人類遺伝学で使われているように感じますが、多くのモデル生物の遺伝学ではAA, BBのような表記はしません。 遺伝子や変異を示す記号が一文字なら良いのですが、長いと分かりにくいでしょう。例えば、人間で ヘモグロビンβ(HBB)の地中海性貧血アリルはHbH (HBBのアリルはHbSも含め732種類ある(2008年6月現在))と略されますが、ホモ接合体の患者さんをHbHHbHと書いたら何これ???です。

■混乱の原因

以下の点が明示されないまま教えられると、物事を論理的に考えられる優秀な高校生ほど混乱してしまうのではないかと思います。
●遺伝子とアリル(対立遺伝子)もしくは表現型の混同
●遺伝子の記載方法は全生物で共通ではない
●高校の生物での遺伝学

●遺伝子・遺伝子型とアリル(対立遺伝子)もしくは表現型の混同

大文字小文字の表記が混乱する原因は、その記号がDNAとしての「遺伝子 (Gene)」 を指すのか、突然変異の表現型としての「アレル (Allele アリルとも発音)」を指すのかの混乱が大きいのではないでしょうか。
前述のメンデル遺伝の模式図にあるABO式血液型を例に取ると、
表現型(Phenotype): A, B, O, AB
遺伝子記号(Symbol): ABO
遺伝子名(Name): ABO blood group (transferase A, alpha 1-3-N-acetylgalactosaminyltransferase; transferase B, alpha 1-3-galactosyltransferase)
アリル: 主にA1, A2, B, O。厳密には83種類( 詳しくはNCBIのデータベース「Compilation of ABO alleles」参照)
遺伝子型(Genotype): 「AO」型はABO*A101/ABO*O01のように表示。
高校生物の教科書に必ず出てくるメンデルの法則には、
AABB x aabb → AaBb x AaBb → AABB, AABb, AbBB, AaBb....
のような記載があります(英語のオリジナル論文でも同様)。
メンデルは論文で遺伝子に相当する概念を「Merkmale(英訳でcharacter, 訳すと特徴)」としていた。それぞれの「特徴」は green, yellow などと記載し、交配のモデルでは、模式的にABCの記号を用いた。
メンデル自身は、ABCの記号を遺伝子名・記号として扱っていない(7種類のcharactersに対して、記号はABCのみで一対一でない)。
メンデル遺伝学を教える先生方は英語のオリジナル論文を一読することをお薦めしたい。

今でこそ多くのモデル生物のゲノム情報が解読されていますが、 メンデルの頃(1865年)には遺伝子という言葉すらなく遺伝子の本質はDNAであること(1944年)も、それが染色体もに乗っていることすらも分かっていなかったのです。
優劣の大文字小文字が遺伝子名と無関係か?というとそうでもありません。 ショウジョウバエの遺伝子名は最初に発見された変異体が優性か劣性かで大文字か小文字が決まります。 ただし、一回命名されたら遺伝子名は固定され、コロコロ変わることは有りません。
劣性の突然変異、例えばショウジョウバエのw (white) は最初に見つかったのが劣性だったので、それがそのまま遺伝子名となり小文字で表記します。 あるショウジョウバエの遺伝子型を指すとき、w  と書いたらwhite遺伝子が無い変異で、目が白いハエです。強いて野生型のw (white) 遺伝子を指し示す場合は + (プラス)と表記するか、w+ (もしくはw[+] )と表記します。突然変異のアリルを示す場合はアリル1番なら w1 (もしくはw[1] )と表記します。
同じ遺伝子の突然変異に別の名前が付く事もあります。Clock の場合はショウジョウバエでもJrk変異(優性なので頭文字は大文字)が見つかっていましたが、哺乳類で先に遺伝子が得られたので、ショウジョウバエ Jrkは Clock の一つのアリルとしてClockJrkと 表記され、遺伝子名は優性が先に見つかっていたので大文字になりました。別の劣性アリル arClockarと 表記され、遺伝子名自体の大文字小文字は変化しません。
いまではゲノム情報が先にあるので「突然変異や遺伝病の原因を見つけたらある遺伝子だった」となります。ショウジョウバエの場合は、「正常遺伝子は優性で ある」という考えで、変異体の無い遺伝子名は大文字で始まることになります。
マウスの時計変異体の例では、After-hours, Overtime 変異体は既に登録されていたFboxl3の アリルということになります。それぞれ、Fboxl3After-hours, Fboxl3Overtimeと表記されます。

●遺伝子の記載方法は全生物で共通ではない

遺伝子やアリルの表記は全生物で共通していない事もわかりにくさの原因です。
広く様々な生物を扱われる皆さんには申し訳ありませんが、遺伝子の記載は生物ごとに異なるという前提で考えねば成りません。
特に動物、植物、微生物の間で大きく違うように感じます。 まとめると下表のようになります。ハエ、マウス、ヒト以外は専門外なので詳しくありません。
遺伝子表記法の生物ごとの違い
生物(遺伝子命名規約) 遺伝子記号 (フルネーム) アリル 産物
ショウジョウバエ
こちらの解説参照
最初の変異体が劣性なら小文字始まり
w (white)
最初の変異体が優性なら頭大文字
Clk (Clock)
命名時に変異体が無かった場合も
頭大文字
優性: 頭大文字、劣性: 小文字肩書き
ClockJrk, Clockar
全て大文字
CLK (CLOCK)
マウス・ラット
 英語(MGI)
 和訳(理研)
 和訳(熊本大)
頭文字のみ大文字
Clock (circadian locomoter output cycles kaput)
優性: 頭大文字、劣性: 小文字、肩書き
ClockDominant , Clockrecessive
全て大文字
CLOCK
ヒト 全て大文字
GENE
大文字か数字、アステリスク
GENE*A01
全て大文字
GENE
線虫(または こ ちら) 小文字3文字と数字
unc26 (UNCoordinated-26)
1-2文字と番号、ハイフン
unc26-e205, unc26-ad473
全て大文字
UNC26
トウモロコシ 小文字
bt1 (brittle endosperm1)
優性: 頭大文字、劣性小文字、ハイフン
Bt1-Tx303, bt1-sh3
標準型 (野生型) -R or -Ref
bt1-R
全て大文字
BT1
シ ロイヌナズナ
(変異はこ こ
(AT)遺伝子名又はATxG#####。全て大文字(AT =Arabidopsis thaliana, G = gene, x =染色体番号(1〜5), ##### = 染色体上の位置)
CRY1 (CRYPTOCHROME 1) , AT1G04400
野生型: 大文字遺伝子名
変異: 小文字遺伝子名
野生型: CRY1-1
劣性変異: cry1-2
優性変異: cry1-3D
全て大文字
CRY1
出芽酵母 3文字と整数
RAD52
優性アリル(多くの野生型を含む)は大文字、劣性アリルは小文字(規定無し)
rad52-1
頭大文字+p
(規定無し?)
Rad52p
細菌 小文字3文字と大文字アルファベット
lacZ (これがフルネーム)
遺伝子名とアリル番号
lacZ999
小文字(一般名詞)
beta-D-galactosidase
(表現型はLac+, Lac-)
赤文字は実在せず、例示のための見本。遺伝子・アリルをイタリックにする事は大半の種で規定されている(ヒトではイタ推奨、カエルはイタ禁止)。
「頭大文字」はキャピタライズ(頭文字だけ大文字)を便宜的に略したものです。
アリルを肩書き(上付文字 Geneallele )で示すのはかなり古い文献から見受けられます。しかし肩書きは小さくて見づらく、表示もしにくいので、廃れる方向でしょうか? ショウジョウバエで書式が使えない時はGene[allele] と括弧で書きます。

ヒトとマウスの遺伝子命名規約のオリジナルと拙訳を載せます。
◇ヒト(HUGO)
 Human gene symbols are designated by upper-case Latin letters or by a combination of upper-case letters and Arabic numerals, (後略).
 ヒトの遺伝子記号は大文字のローマ字、もしくは大文字とアラビア数字の組合せで示される。
◇マウス・ラット(MGI)
Symbols begin with an uppercase letter followed by all lowercase letters except for recessive mutations, which begin with a lowercase letter.
 (マウスの)遺伝子記号は一文字の大文字で始まり後は全て小文字とする。ただし、劣性変異は例外とし小文字で始まる。
規約がない種は一番近い種に準ずるしかなさそうです。チンパンジーなどサルはヒトの基準に従い、齧歯類はマウスの基準に従っているようです。

●遺伝子名の付け方

遺伝子名
酵母や大腸菌のような微生物や線虫では「英語3文字+数字」のように厳格です。
例えば表「遺伝子表記法の生物ごとの違い↑」の様に大腸菌では「lacZ」が正式な名称で、別にフルネームはありま せん。笑い話のようですが、ショウジョウバエの論文で GAL4 について審査員にフルネームを書くように指示された、というエピソードもあるそうです(Jfly 「GAL4の正式名称は?」)
ヒトやショウジョウバエでは命名はかなり自由です。
最初に報告された論文での名称が使われます。通常は発見者が命名します。 ショウジョウバエでは古典文学や商品名、動物名などまで使われます。 ただし、「GAL4の正式名称は?」にあるように動物名は避けるべきだったと思います。
同じ遺伝子に複数の名前がついてしまう事はよくあり面倒の元になります。
ただし、公式な遺伝子名は1つで、他の呼び名は別名(synonymシノニム, aliaseエイリアス)と呼ばれます。


遺伝子記号(gene symbol)
遺伝子記号は短くまとめられた数文字の英文字(+数字)です。
α, β, γは使えないので、a, b, gと略されます
遺伝子記号は一つに統一されていますが、哺乳類ではこれも変更された事があります。
前述のように、微生物や線虫では遺伝子記号=遺伝子名です。

●高校生物での遺伝学

さらに、高校生レベルでの教科書では遺伝学が独自の進化を しているようです(Jfly「高校の遺伝教育」参照)。
生物ごとに異なるので、最大公約数的な教え方にならざるを得ないのでしょうか。
高校生物で「遺伝」を学んだ高校生が全て遺伝学の専門家になるのではありませんので、分かり易い教育のためにそれも仕方ないと思います。
しかし、あからさまな間違いは避けて欲しいと感じます。

例えば w (white)の遺伝で、野生型をW,変異をwとする記述を見受けます。
これも表現形質と遺伝子の表記の混同でしょう。
野生型は w+ で絶対に大文字にはしません(W遺伝子は Wrinkled )。さらに ww も別の遺伝子。
パンネットスクエアにメンデル式と規約式でショウジョウバエの white の遺伝を書いてみます。
メ ンデル式の書き方 規 約に基づく書き方
    オス wY
w Y
メス Ww  W Ww 赤目 WY 赤目
w ww 白目 wY 白目

X染色体を強調して↓の様にも書かれる
    オス XwY
Xw Y
メス XWXw  XW XWXw  赤目 XWY 赤目
Xw XwXw  白目 XwY 白目
    オス w1118/Y
w1118 Y
メス w+/w1118 w+ w+/w1118  赤目 w+/Y 赤目
w1118 w1118/w1118 白目 w1118/Y 白目


伴性遺伝なのでアリル2種類で6通りの組合せがあるが、一例のみ示す。配偶子の出現確率(1/2)は略してある。white 遺伝子には多くのアリルがあり、ここでは w1118 を例に用いた。
一文字の「記号」で「あり」「なし」だけを表現する場合にはメンデル式の方が分かり易いのは否めません。
中学・高校までの教育でどうしても用いるなら「遺伝子記号」ではなく「暫定的に遺伝子を示す記号」と断った上でならよいかもしれません。
現実には遺伝子名は複雑な物もあり、アリルも多数有るので、「教育的記述」では対応できなくなるのです。 こちらの解説に書かれているヘアリーとヘッジホッグですが、表記法を比べると、
【正式】 h+ hh21/h1 hh+ x h+ hh+/h1 hh21 (ハエ研究者なら分かります)
【高校風】 HhhhHH x HHHhhh  (これでは誰にも不明)
【メンデル式】AbaB x ABab  (h[+]=A、h[1] =a hh[+] =B, hh[21]=bとする)
となります。メンデルのように遺伝子名にこだわらずに、暫定的な記号にするとグッと分かり易くなります。教科書・資料で中途半端にリアリティーを出そうとして遺伝子名(もどき)を使うと逆に混乱するでしょう。

遺伝子名が強いて和訳されている場合がありますが避けるべきです。white を白眼というのは「説明」や「英語名の和訳」であって遺伝子の和名ではない事に気をつけるべきでしょう。 「ショウジョウバエの目の色の遺伝」といっても、目の色を変える遺伝子は white 以外にも多数あるのです。

※遺伝子でも、一部の生物ではイタリックにしません。
アフリカツメガエル遺伝子命名規約(英語)
"Gene names should be in lower case and not in italics"「遺伝子名は小文字にし、イタリックにしない」
※制限酵素はタンパク質でも学名由来の部分はイタリックにします。
例えば、EcoRIは大腸菌(Escherichia coli)RY13 株から1番目に得られた制限酵素なので Eco の部分だけイタリックです。番号はローマ数字(I, II, III, IV...)です。
4文字目以後は株と登録番号ですから、EcoRIはエコアールワン、EcoRVはエコアールブイと読みたくなりますがエコアールファイブです。
学名=斜体は最初の3文字のみです。○HindIII  ×HindIII  ×HindIII
学名と番号の間にスペースを入れる事がありますが、読みやすくするためであり、本来はノースペースです。SalI, SalIIなどスペース無しでは斜体文字が右の文字と交叉するし、エルの後に数字が続くと番号を見誤る可能性があるからです。