肉体労働から産業革命へ！ Nature の記事: 深層学習によって革命を起こした生物学的画像解析の 5 つの分野-AI-php.cn

1立方ミリメートルというと、それほど大きくは感じられません。ゴマ粒ほどの大きさですが、人間の脳のこの小さな空間には、5万本の神経線で接続された約1億3,400万個のシナプスが収容できます。

生データを生成するには、生物学者は連続超薄切片電子顕微鏡を使用して11 か月以内にデータを分析する必要があります数千の組織断片が画像化されます。

最終的に取得されたデータ量は、驚くべき

1.4 ペタバイト(つまり 1400TB、約 200 万枚の CD-ROM の容量に相当) に達しました。 , これは単なる天文学的な数字です。

ハーバード大学の分子細胞生物学者ジェフ・リヒトマン氏は、純粋に手作業で行った場合、人間がすべての神経線を手動で追跡することは不可能であると述べました。実際にこの仕事を効果的に遂行できる人材は十分ではありません。

顕微鏡技術の進歩により大量の画像データが得られるようになりましたが、データ量が多すぎて人手不足となっているのも、コネクトミクスの理由です。

(コネクトミクス、脳の構造と機能的接続をテーマとした研究)、および他の生物学分野における

一般的な現象。しかしコンピュータサイエンス

の使命はまさに、この種の

人材不足の問題、特に最適化された深度を解決することです。学習アルゴリズムは、大規模なデータセットからデータパターンをマイニングできます。マサチューセッツ工科大学ブロード研究所とハーバード大学ケンブリッジの計算生物学者ベス・シミニ氏は、ディープラーニングはここ数年で生物学を大きく押し上げてきたと述べています。研究ツール。

以下は、Nature の編集者がディープラーニングによってもたらされる生物学的画像解析の5 つの分野

を要約したものです。

大規模コネクトミクス

深層学習により、研究者はショウジョウバエ、マウス、さらには人間からもますます複雑なコネクトームを生成できるようになります。

これらのデータは、神経科学者が脳の仕組みや、発達や病気の際に脳の構造がどのように変化するかを理解するのに役立ちますが、神経接続をマッピングするのは簡単ではありません

。

2018 年、リヒトマン

は、カリフォルニア州マウンテンビューで

GoogleのコネクトミクスリーダーViren Jainと提携しました。チームが必要とする人工知能アルゴリズムのソリューションを見つけるため。コネクトミクスにおける画像解析タスクは実際には非常に難しく、これらの細いワイヤー、細胞の軸索および樹状突起を長距離にわたって追跡できなければなりません。従来の画像このタスクでは処理メソッドに多くのエラーが発生するため、このタスクには基本的に役に立ちません

。

これらの神経鎖は、1 ミクロンよりも細く、数百ミクロン、さらには数ミリメートルの組織に及ぶこともあります。

そして、ディープラーニングアルゴリズム

は、コネクトミクスデータを自動的に分析できるだけでなく、

非常に高い精度を維持することもできます。研究者は、関心のある特徴を含む注釈付きデータセットを使用して、他のデータの同じ特徴を迅速に識別できる複雑な計算モデルをトレーニングできます。

欧州分子生物学研究所のコンピュータ科学者であるアンナクレシュク氏は、深層学習アルゴリズムを使用するプロセスは「例を与える」ことに似ていると考えています。十分な例がある限り、、すべての問題を解決できますすべて解決しました。

しかし、ディープラーニングを使用したとしても、リヒトマンとジェインのチームには、人間の大脳皮質のセグメントをマッピングするという難しい課題が残っていました。

データ収集段階では、5,000以上の超薄組織切片を採取するだけで

326日

かかりました。2 人の研究者は、約 100 時間を費やして画像に手動で注釈を付け、ニューロンを追跡して、アルゴリズムをトレーニングするためのグラウンドトゥルースデータセットを作成しました。

標準データを使用してトレーニングされたアルゴリズムは、自動的に画像をつなぎ合わせ、ニューロンとシナプスを識別し、最終的なコネクトームを生成します。

Jain のチームは、この問題を解決するために、数千のテンソルプロセッシングユニット (TPU)を含む大量のコンピューティングリソースも投資し、また数100 万 TPU 時間に必要なデータの前処理に数か月かかります。

研究者は現在収集されている最大のデータセットを取得しており、それを非常に細かいレベルで再構成できますが、この量のデータは約 0.0001% にすぎません。人間の脳

#アルゴリズムとハードウェアが向上するにつれて、研究者はより大きな脳領域をマッピングし、同時に細胞小器官やタンパク質などのより多くの細胞の特徴を解決できるようになるはずです。

少なくとも、ディープラーニングは実現可能性を提供します。

仮想組織学

組織学 (組織学)は、化学的または分子染色に基づいて疾患を診断する医学における重要なツールです。

しかし、プロセス全体は時間と手間がかかり、通常は完了するまでに数日、場合によっては数週間かかります。

生検は薄片にスライスされ、細胞および細胞内の特徴を明らかにするために染色され、病理学者は結果を読んで解釈します。

カリフォルニア大学ロサンゼルス校のコンピューターエンジニアであるアイドガン・オズカン氏は、ディープラーニングによってプロセス全体を高速化できると考えています。

彼は、カスタマイズされた深層学習モデルをトレーニングし、コンピュータシミュレーションを使用して組織切片を染色し、同じ切片上で数万の組織切片を染色しました。染色されたサンプルがモデルに供給され、モデルはサンプル間の差を計算します。仮想染色の時間的な利点 (一瞬で完了できる) に加えて、病理学者は仮想染色と従来の染色の間にほとんど違いがないことを観察を通じて発見しました## ＃、プロの人も違いがわかりません。

実験結果は、このアルゴリズムが乳がんバイオマーカー HER2 の分子染色を秒で再現できることを示しています。このプロセスは、通常、研究室が必要とする組織学では検出が困難です。少なくとも 24 時間。

3 人の乳房病理学者からなる専門委員会が画像を評価し、従来の免疫組織化学的染色と同等の品質と精度があると判断しました。Ozcan 氏は、医薬品開発において仮想染色を商業化する可能性を見出していますが、組織学において有毒な染料や高価な染色装置の必要性をなくしたいと考えています。

セルの検索

セル画像からデータを抽出したい場合は、画像内のセルの実際の位置を知る必要があります。このプロセスはセルとも呼ばれます。セグメンテーション（細胞セグメンテーション）。

研究者は、顕微鏡で

細胞を観察するか、ソフトウェアで

細胞の輪郭を 1 つずつ説明する必要があります。

カリフォルニア工科大学の計算生物学者であるモーガンシュワルツ氏は、処理を自動化する方法を模索しています。画像データセットがますます大きくなるにつれて、従来の手動による方法もボトルネックに直面しています。一部の実験は自動化なしでは分析できません。

シュワルツ大学の大学院顧問である生物工学者のデビッド・ヴァン・ヴァレン氏は、一連の人工知能モデルを作成し、deepcell.org Web サイトで公開しました。これは、生きた細胞の計算と分析、保存に使用できます。組織画像内の細胞とその他の特徴。

Van Valen は、スタンフォード大学の癌生物学者 Noah Greenwald などの共同研究者とともに、迅速に実行できる深層学習モデル Mesmer も開発しました。さまざまな組織タイプの細胞と核を正確に検出します。

Greenwald 氏によると、研究者はこの情報を使用して癌性組織と非癌性組織を区別し、治療前後の違いを探したり、画像の変化に基づいて、一部の患者がなぜ治療を行うのかをよりよく理解できる可能性があります。患者は反応するか反応しないか、また腫瘍のサブタイプを決定します。

タンパク質の局在化

Human Protein Atlas プロジェクトは、深層学習のもう 1 つのアプリケーションである細胞内局在化を利用しています。スタンフォード大学の生物工学者エマ・ランドバーグ氏は、このプロジェクトにより過去数十年にわたり、人間の細胞や組織、タンパク質の発現の様子を描いた何百万枚もの画像が生成されてきたと述べた。

当初、プロジェクト参加者はこれらの画像に手動で注釈を付ける必要がありましたが、この方法は持続不可能であったため、Lundberg は人工知能アルゴリズムの助けを求め始めました。

過去数年、彼女はKaggle チャレンジでクラウドソーシングソリューションを開始し始め、科学者や人工知能愛好家がさまざまなコンピューティングタスクを完了して賞金を獲得しました。 2 つのプロジェクトの賞金はそれぞれ37,000 米ドル

と

25,000 米ドルです。出場者は教師あり機械学習モデルを設計し、タンパク質マップ画像に注釈を付けます。

Kaggle チャレンジで得られた結果もプロジェクトメンバーを驚かせました。優勝したモデルのパフォーマンスは、Lundberg の以前の

タンパク質局在パターンのマルチラベル分類# # よりも約 20% 優れていました。 # 、細胞株に一般化することができ、細胞の複数の場所に存在するタンパク質を正確に分類するという新たな業界のブレークスルーも達成しました。

モデルが手元にあれば、生物学的実験を進めることができます。ヒトのタンパク質は同じタンパク質であるため、その位置は重要です。存在する場所が異なれば動作も異なり、タンパク質が核にあるかミトコンドリアにあるかを知ることは、その機能を理解するのに役立ちます。

肉体労働から産業革命へ！ Nature の記事: 深層学習によって革命を起こした生物学的画像解析の 5 つの分野動物の行動の追跡

スイスのエコール・ポリテクニック・フェデラーレ・ド・ローザンヌのキャンパス内にあるバイオテクノロジーセンターの神経科学者マッケンジー・マティスは、脳がどのように行動するかについて長い間興味を持ってきた。行動を推進します。

この目的を達成するために、彼女は DeepLabCut と呼ばれるプログラムを開発しました。これにより、神経科学者は

動物の姿勢や細かい動きをビデオから追跡し、

「猫」のビデオなどを変換できるようになります。動物の記録はデータ化されます。

DeepLabcut は、研究者がボタンをクリックするだけでビデオをアップロードして注釈を付け、深層学習モデルをトレーニングできるグラフィカルユーザーインターフェイスを提供します。今年の 4 月、Mathis のチームは

複数の動物

のポーズを同時に推定できるようにソフトウェアを拡張しました。これは人間と人工動物の両方にとって有益です。インテリジェンス全く新しい挑戦です。

DeepLabCut によって訓練されたモデルをマーモセットに適用したところ、研究者らは、これらの動物が非常に近づくと、体が一直線に並び、同様の動物の方を向くことを発見しました。離れているときは、お互いに向かい合う傾向があります。生物学者は、2 匹の動物がどのように相互作用し、世界を見つめ、観察するかを理解するために動物の姿勢を特定します。

以上が肉体労働から産業革命へ！ Nature の記事: 深層学習によって革命を起こした生物学的画像解析の 5 つの分野の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。