機械学習

ブログ

ホームページホームページ / ブログ / 機械学習

Aug 19, 2023

機械学習

Scientific Data volume 10、記事番号: 558 (2023) この記事を引用 278 アクセス 1 Altmetric Metrics の詳細 私たちの研究では、リモート センシング用にマルチモーダルな注釈付きデータセットを収集することに着手しました。

Scientific Data volume 10、記事番号: 558 (2023) この記事を引用

278 アクセス

1 オルトメトリック

メトリクスの詳細

私たちの研究では、深層学習に適したマヤ考古学のリモートセンシング用のマルチモーダルな注釈付きデータセットを収集することに着手しました。 このデータセットは、ユカタン半島中央部にある古代マヤ最大の都市中心部の 1 つであるチャクトゥン周辺のエリアをカバーしています。 データセットには、航空機レーザー スキャン (ALS) データからのラスター視覚化と樹冠高さモデル、Sentinel-1 および Sentinel-2 衛星データ、および手動データ アノテーションの 5 種類のデータ レコードが含まれています。 手動アノテーション (バイナリ マスクとして使用) は、調査エリア内の 3 つの異なるタイプの古代マヤ構造物 (クラス ラベル: 建物、プラットフォーム、およびアグアダ (人工貯水池))、その正確な位置、および境界を表します。 このデータセットは、物体認識、物体位置特定 (検出)、セマンティック セグメンテーションのための畳み込みニューラル ネットワーク (CNN) などの機械学習で使用する準備ができています。 私たちは、より多くの研究チームがマヤ考古学の調査用に独自のコンピューター ビジョン モデルを開発したり、既存のモデルを改良したりできるように、このデータセットを提供したいと考えています。

航空機レーザー スキャン (ALS) 調査は、伝統的な考古学的景観調査を大幅に加速および拡張したため、特に古代マヤの森林地域における考古学的な「遺跡」分布に関する知識の進歩に極めて重要であることが証明されています 1,2,3。 景観考古学における ALS の研究利用には、通常、定住、都市化、農業生産、農業生産のマッピングと分析を含むがこれらに限定されない、通常相互に関連するさまざまな状況における自然および文化的特徴の特定、位置特定、記録および調査が含まれます。水管理4、5、6、7、8、9、10、11。

考古学者は通常、表面特徴の認識を高めるラスター視覚化の形式で ALS データを検査します 12、13、14。 人間による視覚的な分析とデジタル化には時間がかかり、詳細レベル、構造物の数、記録方法によっては、数百平方キロメートルの調査に数か月かかる場合があります。 古代マヤ地域の大規模で高解像度の公的に利用可能な ALS データセットが不足しているにもかかわらず、分散された民間および公的資金により、数平方キロメートルにわたるサイト固有の景観研究だけでなく、実施することも可能になりました。例 7,15,16 ,17,18 だけでなく、数百または数千平方キロメートルにわたる大規模な研究も行われます (例:3,5,11,19,20,21,22,23)。 データ量が多いため、特にオブジェクトの位置だけでなく形状も示す必要がある場合、データセット全体に注釈を付けることが困難になります。 人間の目視検査とデジタル化の主観性、および人間の通訳間のばらつきも問題です24。 したがって、考古学的オブジェクトを見つけてその境界を自動的に描写できるコンピュータービジョン手法を採用することが急務となっています25,26。 さまざまな機械学習アプローチの中で、ディープ畳み込みニューラル ネットワーク (CNN) はコンピューター ビジョンの現在の最先端技術ですが、通常、トレーニングにはすでにラベル付けされた大量のサンプル 27 が必要です。 このため、メソッドの開発とテストにはラベル付きデータセットが不可欠になります。

私たち自身の以前の研究の 1 つで、CNN が DEM 視覚化から古代マヤの考古学的オブジェクトを分類でき、最大 95% の精度を達成できることをすでに実証しました28。 ただし、分類モデルには、セマンティック セグメンテーションが必要な手動の検査やラベル付けに代わる可能性はありません。 セマンティック セグメンテーションはリモート センシングに容易に適用され、27 によるレビューが示されていますが、医療画像処理ではさらに適用され、CNN は専門家を上回ることがよくあります 29、30、31、32、33、34。

ユカタン半島の中央低地にあるこれまで知られている最大の古代マヤ都市中心地の一つであるチャクトゥン周辺地域でALSデータを収集する当初の目的は、水管理、農業、居住力学、および社会政治的状況をより良く理解することであった。この地域に住む古代マヤの組織11,35。

_.tif, where the data source can specify a mask, ALS visualisations (lidar), CHM, or Sentinel data (S1 or S2). The sequential number is a unique identifier of a data record; all files with the same sequential number represent the same geographical area, but differ in the number of pixels (480 × 480 pixels, 240 × 240 pixels or 24 × 24 pixels) and bit depth (8-bit integer or 32-bit float) (Table 7)./p>