この度、Ristデータ分析チーム顧問を務める小野寺和樹とRist社員の石圭一郎が共著者を務めた論文「Deep learning models for predicting RNA degradation via dual crowdsourcing」が、2022年12月14日付のNature Machine Intelligenceに掲載されたことをお知らせいたします。
本論文は、加水分解に対して不安定な性質をもつmRNAのより安定的な構造を探るために、データ分析モデルを活用した研究について報告したものです。mRNAはヒトの体内でタンパク質の合成に関わる分子のことで、近年では新型コロナウイルスのmRNAワクチンとしても注目されています。本研究では、世界最大のデータ分析プラットフォーム「Kaggle」のコンペティションにおいて、上位成績を獲得したチームまたは個人が開発したモデルがmRNAのデータ分析に活用されました。このコンペティション(以下:本コンペ)には世界中から全1,636チームが参加し、Ristデータ分析チーム顧問を務める小野寺が参加するチームは準優勝、Rist社員の石は個人で金メダルを獲得。二人は分析モデルの開発者として論文の執筆に携わりました。
コンペティションの結果はこちら
本コンペが実施された時期は2020年9月10日〜10月6日で、世界的に新型コロナウイルスが流行したことが背景にあります。当時、新型コロナウイルスにおけるmRNAワクチンは、輸送中に成分組織が崩壊する恐れがあるため輸送コストがかかったり、徹底した温度管理を行うために大量の冷凍庫が必要なため輸送拠点が限定されるといった問題がありました。一刻も早い安定的なワクチン開発が急がれる中、mRNAの安定性を予測する高精度なモデルを短期間で開発すべく、ワクチンの研究を行う米スタンフォード大学は世界中のデータサイエンスの知見を集めることが可能なKaggleを活用し、研究に結びつけました。
本論文では、Kaggleコンペの上位入賞者が開発した分析モデルが極めて優れた精度と結果を示したこと、また、喫緊の課題に対してKaggleのようなクラウドソージング型のデータ分析プラットフォームが有用である可能性を示唆しています。
Kaggleは今後、あらゆる分野におけるデータ分析の課題に対し、積極的に活用されていくことが期待されます。
RistのKaggle制度
Kaggleとは、企業やデータサイエンティストを繋ぐ、世界最大のデータ分析手法関連のプラットフォームです。Kaggleのコンペでは企業や団体がデータ分析に関する課題を投稿し、参加者は課題に対してデータ分析力や機械学習モデルの性能を競います。
Ristには、登録者数1100万人(※2022年12月時点)を超えるKaggleの中でMaster以上の称号を持つ世界トップクラスのエンジニアが多数在籍しており、今回論文の共著者を務めた小野寺はKaggle Grandmaster、石はKaggle Masterの称号を持っています。Ristでは技術力向上のために積極的なKaggleコンペへの参加を促しており、実績に応じて業務時間の一部を利用したKaggleへの参加を認める制度を導入しています。
Rist Kaggleチーム制度について
掲載論文
論文名
Deep learning models for predicting RNA degradation via dual crowdsourcing
著者情報
Hannah K. Wayment-Steele、Wipapat Kladwang、Andrew M. Watkins、Do Soon Kim、Bojan Tunguz の各著者が等しく貢献しました。
メンバーとその所属のリストは、補足情報に記載されています。
著者と所属
・Department of Chemistry, Stanford University, Stanford, CA, USA
Hannah K.Wayment-Steele
・Eterna Massive Open Laboratory, Stanford, CA, USA
Hannah K. Wayment-Steele, Wipapat Kladwang, Andrew M. Watkins, Do Soon Kim,
Jonathan Romano, Roger Wellington-Oguri, John J. Nicol & Rhiju Das
・Department of Biochemistry, Stanford University, Stanford, CA, USA
Wipapat Kladwang, Andrew M. Watkins, Do Soon Kim, Bojan Tunguz, Jonathan Romano & Rhiju Das
・Prescient Design, Genentech, San Francisco, CA, USA
Andrew M. Watkins
・NVIDIA Corporation, Santa Clara, CA, USA
Bojan Tunguz
・Kaggle, San Francisco, CA, USA
Walter Reade & Maggie Demkin
・Department of Computer Science and Engineering, State University of New York at Buffalo, Buffalo, NY, USA
Jonathan Romano
・High-flyer AI, Hangzhou, Zhejiang, China
Jiayang Gao
・NVIDIA Corporation, Minato-ku, Tokyo, Japan
Kazuki Onodera
・DeNA, Shibuya-ku, Tokyo, Japan
Kazuki Fujikawa
・Yanfu Investments, Shanghai, China
Hanfei Mao
・IDLab, Ghent University, Technologiepark-Zwijnaarde, Gent, Belgium
Gilles Vandewiele & Bram Steenwinckel
・The Wellcome Centre for Anti-Infectives Research, College of Life Sciences,
University of Dundee, Dundee, UK
Michele Tinti
・Universal Knowledge Inc., Tokyo, Japan
Takuya Ito
・Keyence Corporation, 1-3-14, Higashi-Nakajima, Higashi-Yodogawa-ku, Osaka,
Japan
Taiga Noumi
・Department of Chemical Engineering, Texas A&M University, College Station, TX,
USA
Shujun He
・Rist Inc., Shimogyo-ku, Kyoto, Japan
Keiichiro Ishi
・Korea Atomic Energy Research Institute, Daejeon, Republic of Korea
Youhan Lee
・Kakao Brain Corp, Seongnam, Gyeonggi-do, Republic of Korea
Youhan Lee
・H2O, Istanbul, Turkey
Fatih Öztürk
・Clover Health, Hong Kong, P. R. China
King Yuen Chiu
・Afiniti, Istanbul, Turkey
Emin Öztürk
・Center for Informatics Science, Nile University, Sheikh Zayed, Giza, Egypt
Karim Amer & Mohamed Fares
・National Research Centre, Dokki, Cairo, Egypt
Mohamed Fares
・Howard Hughes Medical Institute, Stanford University, Stanford, CA, USA
Rhiju Das
掲載誌
Nature Machine Intelligence(2022年12月14日付)
掲載ページURL
https://www.nature.com/articles/s42256-022-00571-8
出版元:Nature Portfolio
掲載されている情報は、発表日現在の情報です。最新の情報と異なる場合がありますのでご了承ください。
Ristでは今後もKaggleチームを中心に様々なコンペに積極的に参加し、技術向上を図り、お客様の課題解決に貢献していきます。
* 当サイトに記載する会社名、ロゴ、システム名、商品名、ブランド名などは、各社の商号、登録商標、または商標です。