
Ribbit - アヌラン種の自動識別と分類のためのウェブアプリ

Ribbitは市民科学ウェブアプリで、少数ショット転送機械学習を使ってカエルやヒキガエルの鳴き声を記録、同定、分類し、クラウドソーシングデータを世界生物多様性情報ファシリティ(GBIF)に提供することで、特に世界南部におけるデータギャップに対処している。同定アプリは、生物多様性の自動その場 モニタリングに大きな可能性を提供する(人工知能に関するグローバル・パートナーシップ、2022;Tuia et al .)アヌラン類は生態系の重要な指標であり(Estes-Zumpf et al., 2022)、40%以上の種が絶滅の危機に瀕している。ベータ・テスターは、このアプリがGBIFにデータを提供し、同時に市民科学者が生態系モニタリングに従事できるようにする可能性を明らかにした。生物多様性データにラベル付けするためのオープンアクセスプラットフォームを構築することで、Ribbitは保護団体が脆弱な個体群を保護し、重要な生態系を保全するための戦略を開発することを可能にする。
テックフォーネイチャー賞
私たちのプロジェクトは2024年8月に始まりました。iNaturalist soundsと Anurasetの2つのラベル付き音声データセットを利用し、種の鳴き声の音声記録に基づいて無尾目(カエルとヒキガエル)を分類する機械学習モデルを学習した。どちらのデータセットにも、異常な分布のデータ、つまり希少種や絶滅危惧種のイヌ科動物のインスタンスが含まれていた。この異常を説明し、GBFターゲット4を達成するために重要な、これらの希少種や絶滅危惧種を正しく識別するのに十分なデータをモデルに持たせるために、私たちはiNaturalistの非アヌラリアンの鳴き声、例えばコウモリの鳴き声やコオロギの鳴き声など、アヌラリアンの鳴き声とは頻度が異なる鳴き声でデータを補強しました。この新しいデータセットを使って、少数ショット伝達学習(Ghani et al.具体的には、Birdnetモデル(事前に訓練されたEfficientNet B1モデル)を使用して、無尾類の種の埋め込みを生成し、データの線形プロービングを使用してモデルを微調整した。私たちのモデルは、71種の無尾目動物を同定し、その中には、オーストラリアのサザンベルガエル(Ranoidea raniformis)のような脆弱な種も含まれていました。このモデルは、同定された可能性の高い上位5種の精度は91%、同定された可能性の高い上位1種の精度は72%でした。私たちのウェブアプリ「Ribbit」は、この最高性能のモデルを使用して2024年12月にリリースされ、テストでは記録された種がトップ1に入ることがほとんどであったため、ユーザーからのフィードバックは概ね好意的でした。私たちのプロジェクトは、カエルの同定にAIを活用した初の無尾類に特化した市民科学アプリケーションという点でユニークである。
カリフォルニア大学バークレー校情報学部
コンテクスト
対処すべき課題
Ribbitは、生物多様性モニタリングにおける環境、社会、経済の重要な課題に取り組んでいます。環境面では、このアプリはデータ収集のギャップ(GBFターゲット14)、特にグローバル・サウスに取り組んでいます。アヌラン種の40%以上が絶滅の危機に瀕しており(Estes-Zumpf et al., 2022)、従来のモニタリング手法では生態系の健全性と生物多様性の変化を包括的に捉えることができない。
社会的には、Ribbitは市民科学者に利用しやすい生態系モニタリングツールを提供することで、科学研究を民主化する。市民科学者に力を与えることで、このアプリは専門的な研究と地域社会との垣根を取り払い、個人が生物多様性研究に貢献する有意義な参加機会を創出する。
経済的には、資源集約的な従来のモニタリング手法に代わる、費用対効果の高い選択肢を提供する。Ribbitは、クラウドソーシングによるデータ収集と高度な機械学習を活用し、研究コストを削減すると同時に、研究者や保全団体のデータ収集能力を拡大します。
所在地
プロセス
プロセスの概要
生物多様性の損失を軽減することを中核的な目的とし、他の構成要素はこの取り組みを戦略的にサポートする。市民科学のアプローチは、重要な知識のギャップを埋める包括的なデータ収集メカニズムを構築することで、生物多様性の課題に直接取り組んでいます。革新的なテクノロジーを通じて、このプロジェクトは個人の貢献を生態系モニタリングのための強力な科学的リソースに変えます。
市民科学とコミュニティの参加によってデータ収集が促進され、地元の参加者と世界的な保全活動が結びつきます。教育ツールとしてのリビットは、市民を受動的な観察者から能動的な環境スチュワードへと変貌させる。アプリで収集されたデータの民主化は、プロジェクトのインパクトを増幅する重要なインフラとして機能する。科学的研究をアクセスしやすく参加型にすることで、このソリューションは、専門研究者と地域住民の間の伝統的な障壁を取り払う。このオープンアクセス・アプローチにより、収集されたデータは自然保護団体、研究者、政策立案者によって活用され、市民による観察から有意義な環境保護活動への直接的な道筋が形成される。
ビルディング・ブロック
データの民主化
Ribbitのデータ民主化へのアプローチは、市民主導の科学的貢献のプロセスを注意深くキュレーションしたものです。iNaturalist soundsとAnurasetの既存の公開データセットを活用することで、このアプリケーションは音響生物多様性モニタリングの強固な基盤を確立します。これらの初期データセットは、機械学習トレーニングのための包括的なベースラインを提供し、無尾類同定のための高品質な初期モデルを保証します。
このアプリケーションの革新的なデータ収集戦略は、情報収集にとどまらず、ユーザー投稿データの厳格な品質管理プロセスを実施しています。市民から提出された各記録は、グローバル生物多様性情報ファシリティ(GBIF)に貢献する可能性がある前に、慎重な検証を受けます。このアプローチは、受動的なデータ収集を、市民が保全研究に有意義に貢献できる能動的で協力的な科学的プロセスへと変化させ、GBFのターゲット14である「あらゆるレベルでの意思決定に生物多様性を統合する」に対応します。
重要なことは、リビットが厳格なデータプライバシーと保護プロトコルを維持していることである。特に希少種や正確な位置情報など、生態系データのセンシティブな性質を認識し、アプリケーションは厳格なユーザー同意メカニズムを実装しています。投稿者の明確な同意なしに、ユーザーデータが共有されたり配布されたりすることはなく、生態学の対象と市民科学者のプライバシーの両方を保護している。
実現可能な要因
- アクセスしやすいテクノロジー:ウェブアプリはデスクトップやモバイルデバイスで動作し、ユーザーはインターネットが利用できない環境でもデータをアップロードできる。
- 堅牢な品質管理メカニズム:科学的な品質記録の高度な評価。
- 倫理的なデータガバナンス:ユーザーのプライバシーと生態系への配慮を優先。
- モデルの定期的な再トレーニング:モデルは6ヶ月ごとに更新され、アプリに組み込まれ、アノテーターによって検証された新しい種についてトレーニングが行われる。
教訓
このプロジェクトを開始したとき、私たちはグローバル・サウスにおけるアヌランの生物多様性データのギャップを認識していました。しかし、アプリケーションのアクセシビリティを向上させ、質的データを追加しようとしたところ、言語表現にギャップがあることに驚きました。現在、私たちのプロジェクトは4つの言語(英語、スペイン語、ポルトガル語、アラビア語)で利用可能で、アクセシビリティを高めています。私たちはウィキペディアのAPIを使用して、これらの4つの言語で私たちの種に関する一般的な情報を取得し、英語とアラビア語では豊富なデータがある一方で、利用可能な情報はスペイン語ではまばらで、ポルトガル語ではさらにまばらであることに気づきました。したがって、「ウィキペディア・データ・ギャップ」を減らすために、スペイン語やポルトガル語を話す科学者など、多様な科学者を巻き込むことが今後の課題になると考えている。このギャップに対処することは、私たちのソリューションのさらなる民主化とアクセシビリティの向上において、極めて重要な行為となるでしょう。
市民科学とコミュニティ参加
市民科学アプリは、自然愛好家を巻き込みながら生物多様性のモニタリングを支援することが示されている(Callaghan et al.)例えば、オーストラリア博物館のアプリである FrogIDは、ユーザーがカエルの鳴き声を録音し、その鳴き声が人間によって検証される。現在までに、FrogIDは移入種のモニタリング(Rowley and Callaghan, 2023)、IUCNのレッドリスト評価への情報提供(Gallagher et al, 2024)、火災の影響評価(Mitchell et al, 2023)、都市化の影響の理解(Callaghan et al, 2020)、カエルの鳴き声行動の研究(Liu et al, 2022)に関連する論文を発表している。私たちの目標は、世界中のアヌラン種で、より短期間に、Ribbitで同様の結果を達成することです。現在までに、FrogIDチームは18,000件を超える鳴き声のバックログを抱えているが、機械学習アルゴリズムの実装により処理時間が大幅に短縮されるため、このアプリを使えば大幅に削減できる可能性がある。
アプリの最初のベータテストでは、50人のユーザーが識別のために録音を提出しました。専門家からは、記録した種がRibbitが予測した種と一致したと指摘され、自然愛好家からは、新しいアヌラン種を紹介する「今日のカエル」機能を楽しんだり、種の名前や最も一般的な鳴き声を通じて馴染みのあるアヌランを再認識することができたと好評を得ている(GBFターゲット11)。
実現可能な要因
- 使いやすさ:ユーザーからのフィードバックを分析することで、ユーザーエクスペリエンスとアクセシビリティを向上させました。
- 既存の市民生態科学アプリの親しみやすさ:FrogID、Merlin、eBird、iNaturalistを参考に、新規ユーザーがすぐに使い始められるようにアプリの主要機能を模倣しました。
- 市民科学アプリを使ったことがないユーザーに対しては、アプリを可能な限りユーザーフレンドリーにすることに注力しました。さらに、よくある質問のセクションには、いつどこで鳴く種を見つけることができるかなど、"How to frog "のヒントが含まれています。
教訓
- 異なるタイプの利用者の間でバランスを取るのは難しい。科学者たちは学名を使うことを提唱したが、自然愛好家たちは学名にはなじまず、一般的な名前を好んだ。しかし、4つの言語すべてですべての種の通称を得ることは困難であることが判明した。これは、世界中の一般的な名前をクラウドソーシングするという、もうひとつの発展の機会である。
このコンテンツには、アプリのオプションの観察セクションに何を含めるか、アプリが提案するカエルがユーザーが見ているカエルであるかどうかを検証する方法などが含まれます。
生物多様性の損失を軽減する
生態系を保全することは、気候変動を抑制し、生態系サービス(GBFターゲット11)を維持するための鍵である。今世紀、100万種以上が絶滅の危機に直面しているが、北半球での観測に偏っている既存のデータギャップでは、保全すべき地域を選択することは困難である。南半球の生物多様性ホットスポットで高密度に見られる絶滅危惧種の保全には、南半球の生物多様性デー タの量を増やすことが不可欠です。両生類は多様な発声をするため音響同定に理想的であり、重要な生態系指標です(Estes-Zumpf et al.,2022)。世界中で7,000種を超える両生類の標識データを増やすことで、保全活動を強化し、脆弱な生態系における 知識ギャップを減らすことができます。生物多様性の損失を軽減するために市民科学のプラットフォームを利用することで、これらの重要な生息地 の環境スチュワードシップを地域で確立することができます(GBF目標20)。
生物多様性に関する最大の市民科学プロジェクトであるeBirdは、世界中のユーザーから1億羽の野鳥を観察しています。これらの観察結果は、「収集された種のリストを通じて、分布、生息数、生息地の利用状況、鳥類の動向を、シンプルな科学的枠組みで記録する」のに役立っている。(Sánchez-Clavijoら、2024)。
種の同定にコンピュータ・ビジョンのアルゴリズムを使用する、もうひとつの市民科学アプリであるiNaturalistも、生物多様性の損失を軽減することに成功している。現在までに、このアプリは全世界で200,000,000件以上、毎月600万件の観察を行っている。iNaturalistでは、研究レベルの観察結果がGBIFと共有され、GBIFはその知識を政策決定、研究、コミュニティ形成に利用している(GBIF, 2023)。
現在、私たちのアプリは世界中で71種のカエルとヒキガエルを同定しています。その多くは国際自然保護連合(IUCN)の絶滅危惧種(LC)に指定されていますが、IUCNの絶滅危惧種はサザン・ベル・フロッグ(Ranoidea raniformis)の1種のみです。このように絶滅危惧種が含まれていないことから、生物音響生態学的モニタリングに多様な専門家が参加する必要性が浮き彫りになった。脆弱な種に関するデータポイントを増やすことで、データ主導の洞察による政策決定に役立てることができる。地元のコミュニティや先住民は、アプリに含まれる種の数を増やす上で重要な資産となるだろう。彼らの地元の知識によって、遠隔地の種を追跡することができるからだ。
実現可能な要因
- データギャップの解消:市民科学者、特に地域コミュニティや先住民族からより多くのデータを得る。
- 環境スチュワードシップの実現:多様な利用者がアクセスできるようにする。
教訓
私たちは当初、南半球におけるデータギャップを減らすことを目標に掲げた。しかし、私たちのモデルを訓練するために、南半球の希少種、隠蔽種、絶滅危惧種のコールを十分に入手することは困難であることが判明した。そのため、モデルのパフォーマンスを向上させるために、私たちは世界中で取り組める限り多くの種に目を向けた。世界中のユーザーを参加させることは、世界南部のようなデータの乏しい地域での記録を増やすことにつながり、将来、絶滅危惧種、希少種、隠蔽種のデータを増やしてモデルを再学習させることができる。
このユーザー参加は、GBFのターゲット20である「生物多様性のための能力構築、技術移転、科学技術協力の強化」という複数のターゲットに完全に合致している。データポイントを増やすことで、GBFターゲット6に対応する侵略的外来種を特定することができるようになる。これは"野生種の持続可能で安全かつ合法的な捕獲と取引の確保"を目指すGBFターゲット5と一致している。
教育ツール
両生類は鳥類や哺乳類よりも脅威にさらされており、急速に減少しています。両生類の個体数は気候変動やツボカビ症、種の売買などの人為的要因など複数の要因によって減少して います。しかし、1294種(22.5%)は鳥類がわずか78種(0.8%)であるのに対して不明な点が多すぎるため、 両生類に対する脅威のレベルが過小評価されていることは間違いありません(Stuart et al.)
この知識不足は、科学研究を民主化する上で、Ribbitのような教育ツールが極めて重要であることを強調している。生態系モニタリングの障壁を下げることで、Ribbitのようなアプリは受動的な観察者を積極的な保全参加者に変える。教育技術は、市民科学者が脆弱な生態系の理解と保護に直接貢献することを可能にし、研究が不十分な地域でのデータ収集の拡大を通じて、重要な研究の限界に対処する。
これらの革新的なプラットフォームは、科学的関与のためのアクセス可能な経路を提供しながら、生物多様性の課題に対する市民の意識を高める。確立された研究インフラを持つ鳥類に特化したアプリとは異なり、無尾類の保全には包括的な市民科学プラットフォームが欠けていた。Ribbitはこの重大なギャップを埋めるために、個人が両生類の研究への重要な貢献者となることを可能にし、 データ不足の流れを変え、テクノロジーを活用した協力的な環境スチュワードシップを通じて世界的な保 全活動を支援します。これは800種を超える両生類に関する情報を4つの言語で含む最初のアプリケーションで、呼び名の種類や写真、 CITES情報(種が人身売買や商業目的で利用されているかどうか、GBFターゲット5と9に対応)、IUCNのステー タス(種が絶滅の危機に瀕しているかどうか、GBFターゲット4に対応)、動物の行動や繁殖に関する一般的な情報など が含まれます。
実現可能な要因
- 専門知識:チームメンバーの1人(Juliana Gómez Consuegra)は、ツボカビを研究している他の専門家と緊密に協力した。
- アクセスしやすいウェブアプリの作成:ウェブアプリの直感的なデザインにより、経験の浅い観察者も参加し、学習することができる。
教訓
目的は自然愛好家を教育することですが、種の売買が増えることは避けたいと考えています。そのため、私たちはユーザー同士がお互いのデータにアクセスできないようにしました。そうすることで、絶滅危惧種の位置が人身売買業者にアプリ上で公開されることはありません。ユーザーは自分のデータにしかアクセスできない。いったんGBIFとデータが共有されると、そのデータは隠蔽され、カエルの正確な位置もユーザーの正確な位置も一般に公開されることはない。このようにして、私たちのアプリケーションは環境に配慮したものとなっている。
影響
Ribbitは環境、社会、経済の各領域でプラスの効果を示しています。環境面では、リビットは71種の異なる無尾両生類でトレーニングされ、絶滅のおそれのある両生類の個体群をモニ タリングするための包括的なツールが作成されました。ベータテストでは16の異なる無尾類の記録と分類に成功し、モデルは91%の確率で最も可能性の高い上位5種の種を 正確に特定しました。これは他の生物音響学の伝達学習ソリューションに匹敵します(Ghani et al.)約67,000のユニークなアヌラの鳴き声のデータセットを利用することで、Ribbitは、生息地の移動の可能性や、未調査地域における個体数の変化を特定することができる。
社会的には、Ribbitのベータテストには50人が参加し、コミュニティ主導の科学研究の新たな道筋を作った。このプラットフォームはデータ収集を民主化し、生態学的研究参加への障壁を軽減する。調査対象となったユーザーの95%は、GBIFと記録を共有することを希望しており、世界の生物多様性データに貢献している。
経済的にも、Ribbitはモニタリングコストを大幅に削減する。従来の生物多様性モニタリングでは、50カ所のモニタリングに、機材、労働力、データ解析を含めて約118,413米ドルが必要であった。対照的に、Ribbitの月間運用コストは、AWSのインフラと熟練した人材を含めて48,543.77米ドルと見積もられている。この費用対効果の高いアプローチにより、実務者は収集したデータに基づく保全活動にリソースを集中させることができる。
受益者
リビットは、研究への参加を通じて市民科学者に利益をもたらし、生態系モニタリングを通じて地域社会に利益をもたらし、さらに、これまで研究されてこなかったが生物多様性の豊かな生態系における無尾類のデータ収集を通じて保全研究者に利益をもたらす。
さらに、ソリューションの拡張性について説明してください。他の地域やエコシステムに複製または拡大できますか?
リビットのソリューションは、革新的な機械学習アプローチによって大きなスケーラビリティの可能性を示し ています。この少数ショット移動学習モデルは、熱帯や亜熱帯地域の生物多様性のホットスポットで特に適用可能で、両生類が豊富な他の生態系に世界的に体系的に拡大することができます。
コアとなる技術アーキテクチャは本質的に適応性が高く、さまざまな地理的状況からの音響デー タをシームレスに統合することができます。様々な生態系から、より多様なアヌランの鳴き声の記録が収集されるにつれて、機械学習モデルは徐々に洗練され、同定精度を高め、種の認識能力を拡大するように補足することができる。この改善メカニズムは、新たなデータの寄与が科学的知識を増やすだけでなく、技術プラットフォームの性能を向上させることを意味する。
再現の可能性は、複数の領域にわたって広がっている。このプラットフォームは、音響的に特徴的な他の動物群にも適応させることができ、昆虫や哺乳類に対する同様のモニタリング・アプローチを可能にする。さらに、この技術により、地域の生態学的状況に合わせてカスタマイズ可能な地域固有のモジュールを開発することができ、特定の環境ニーズに対応する柔軟な研究ツールを作成することができる。データやモデルの改良を共有できる共同研究ネットワークを促進することで、Ribbitは機関や地理的境界を越えて科学的理解を拡大する枠組みを提供する。
このソリューションのオープンアクセスアプローチとモジュール設計は、特にグローバルなスケーリングに適している。ユーザーへのアクセシビリティ、科学的厳密性、継続的な学習を優先させることで、Ribbitは、多様な生態学的研究のニーズに合わせることができる、テクノロジーを活用した生物多様性モニタリングの再現可能なモデルを提供する。
グローバル生物多様性フレームワーク(GBF)
持続可能な開発目標
ストーリー

コロンビアの熱帯雨林でフィールド調査をするのは難しいことだ。相対湿度が100%ということは、フィールドで使用する機材はシリカの中に入れておかなければ生きていけないということだ。電気がないため、録音機器の充電が次の録音セッションに間に合わないこともある。また、現地に赴く時期によっては、内戦が続いているため、治安上の懸念も高かった。私は生物学の修士課程に進み、ウルシガエルのホーミング行動を研究していた2007年に、こうした状況をすべて経験した。私の毎日の仕事は、毎日片道1時間かけてフィールドを往復すること、ハーレクインポイズンフロッグのオスが環境の変化にどう反応するかを調べるため、カエルの鳴き声を再生するスピーカーを設置することなどだった。私の唯一の同行者はヤズという地元のコミュニティメンバーで、彼の人生の物語には感銘を受けた。彼は反政府武装勢力のためにコカの葉を掻くことから、NGOで働くこと、そして人々がカエルウォッチングに出かけられるようなエコロッジを作ることへと転身した。彼の最近の試みを知ったとき、私はこう思った:熱帯雨林へのエキゾチックな旅と科学への貢献を結びつけられたらどうだろう?そこで私は生物学者の同僚に連絡を取り、鳴き声のするカエルを自動的に識別する市民科学アプリのアイデアを提案した。以下はそのうちの1人からのフィードバックである:
「Ribbitの開発、おめでとうございます。私はコロンビアで働いている生物多様性科学者で、eBirdがコロンビアの鳥類のモニタリングや社会的利用に与えた影響を直接目撃する機会がありました。私の答えはたいてい、科学者でなくても鳥と出会い、識別するのが最も簡単だから、というものだが、Ribbitのようなアプリを使えば、永遠にそうである必要はない!
同定を音に頼るのは、野生のカエルの実際の写真を撮ろうとするよりも、普通の携帯電話で録音する方がずっと簡単だ。コロンビアのような巨大な多様性を持つ国では、どの種がいつ、どこに生息しているかというような「単純な」疑問は依然として困難である。
Ribbitが生成するすべてのデータは、この課題を解決するのに役立つだろう。
リナ・M・サンチェス=クラビホ博士
主任研究員
科学情報オフィス
フンボルト研究所
証言者フリアナ・ゴメス・コンスエグラ、リビット・チームリーダー