レ点腫瘍学ノート

日記/2022年/1月25日/データ記憶媒体としてのDNA の履歴の現在との差分(No.1)


#author("2022-01-25T18:24:05+09:00","default:tgoto","tgoto")
#author("2022-12-01T00:43:12+09:00;2022-01-25T18:24:05+09:00","default:tgoto","tgoto")

生物にとっての生命情報の記憶装置であるDNAを、コンピュータなどの情報技術のデバイスの一つと見做して利用しようという研究に関するレビューが掲載されています。

#ogp(https://www.nature.com/articles/s41467-021-27846-9)

*DNAを4進数のデータストレージとみなす [#xf24ccba]

DNAはアミノ酸の配列をデータとして保存し伝達しています。コンピュータの記憶装置(ハードディスクやフラッシュメモリなど)が情報を0と1の2進数に置き換えて保存するのだとすれば、DNAは生物に生存にとって必要となる蛋白質などをA,T,G,Cの4種類の塩基の配列で記録するミクロな記憶媒体と言えます。

実際にはエピゲノムと言って塩基配列の外側にも遺伝子発現の調節などに重要な働きをする情報が搭載されていますが、このDNAの4塩基の配列だけでもかなり膨大な情報を蓄えています。ヒトゲノムならば塩基数は約30億ありますから、約30億の4進数(60億bit)からなる巨大な情報記憶装置と言えるでしょう。

* DNAへのデータの読み書き [#b0340c1a]

次世代シークエンサーなどのDNA解読技術の圧倒的な性能向上によってDNAの塩基配列を従来のサンガーシークエンスなどに比べて圧倒的に高速・大容量で読み出す技術が発展しました。さらにゲノム編集技術などの発展により、DNAを合成して一部の塩基を書き換えたり、他の遺伝子の配列を挿入して繋ぎ合わせたりして中身を編集することもかなり自由にできるようになってきました。

データの書き込みは、DNA合成技術を使います。まず例えば00 = A, 11 = T, 01 = G, 10 = Cなどのように2進数のデータを4塩基に変換します。DNA合成技術によってこの塩基配列どおりにDNAに情報を書き込みます。

読み取るのはシークエンサーによってデータを読み出します。DNAの読み取りは一定の頻度でエラーを生じますが、チェックディジットをも受けることもできますし、パラレルシークエンスのカバレッジを厚くすることで多重的にデータを読み取ればデータの正確性を高めることができます。

情報のコピーはPCR法によっていくらでもDNAを増幅できます。データの運搬や保管のためには、凍結したり乾燥して粉末状態にすることもできます。

* DNAを用いる利点 [#yb4bf198]

DNAは他の情報記憶媒体とは全く違うレベルの記憶密度を誇ります。ひとりの人間の全遺伝子が単一の細胞に収まってしまうことからも分かるように、DNAはミクロでありながら単位重量あたりの保持できる情報量は膨大です。情報密度はCD-ROMで重量1gあたり10MB、HDDやSSDや磁気テープでも1gあたり1TB付近で頭打ちですが、DNAは1gに455EB(エクサバイト)のデータを蓄積できるそうです。

DNAは非常に長寿であることも利点の一つです。情報の保存期間はHDDやフラッシュメモリは10年以下、磁気テープやフロッピーディスクでも寿命が100年を超えることはありませんが、DNAは地中深くの化石から抽出された動物のDNAを読み出したりピラミッドのミイラのDNAを解析することもできるように、保存状態が良ければ数千年でも情報を保存できます。圧倒的な情報密度と長期保存の安定性は他の情報記憶媒体には真似できないDNAストレージの強みです。他にも、DNAは環境中に排泄されても自然環境を汚染しないなどの利点もあります。

* DNAストレージの弱点 [#pef09f0b]

DNAストレージの弱点はいくつかありますが、最も目立つのはその読み書き速度です。現在の汎用データストレージの書き込み速度は1秒あたり1GB程度のスループットを持ちますが、DNA合成で書き込める情報量はせいぜい1秒あたり1KB。また読み書きのランダムアクセスも苦手で、巨大なデータのあちこちを次々と少しずつ読み書きすることができません。

また、費用も問題です。HDDやSSDのコストは1TBで100ドルを下回るほどに安くなっていますが、DNAストレージに情報を書き込むコストは今のところ1GBあたり500〜800万ドルにも及びます。また、データを読み出すたびにもシークエンスのコストがかかります。実用的なコスト水準までどうやって価格を下げるか、簡単なことではなさそうです。

* バーコードや製品タグ [#p5cfb8d7]

DNAに情報を保存しておくことができるので、これを目に見えない商品情報を記録するバーコードや製品タグとして利用するという考えもあるそうです。DNAは食品や衣料に混ぜても人体に害がありませんので(なにしろ私たち自身の体内にもある)、例えば食品の生産者や流通経路の記録に利用したり、綿など衣料素材などに混ぜて自社ブランドを守るのに利用することが考えられたりしているようです。DNAタグは目に見えず非常に微小で体内に入っても無害なので、医薬品の小さな錠剤に文字を印字することが難しくてもDNAタグを用いて錠剤に情報を記載することなどもできます。

* 情報暗号化や認証技術にも [#sd9ff3dd]

このバーコードや商品タグの考え方のさらに発展形として、目に見えない高密度な情報記録手法を利用する方法はさらにいろいろな応用方法が考えられています。複雑な塩基配列を乱数生成することによる情報の暗号化・秘匿化や、DNAに記録された情報が一致しているかどうかを鍵とする個人認証など、セキュリティ面への応用も考えられているようです。

まだまだ実用化のためには(特にコストや読み書き速度などの)解決すべき課題がたくさんありますが、将来性が期待される領域です。日本企業が技術を持っている分野もあり、活躍が楽しみですね。

#navi(日記/2022年)
#pcomment