動物所白明研究組合作提出地理大數據實時呈現的新方法
地理空間數據分析在生物多樣性、移動通訊、網絡監控、環境監測等諸多領域中應用廣泛,比如生物地理分析、即時通訊場景的位置共享、手機定位、衛星定位等案例,因此大規模地理數據的快速呈現具有重要的理論意義和實際應用價值,然而由於種種技術難題,目前尚無法有效實現地理動態大數據的實時性呈現。這個技術問題實際上可以被刻畫為一個數學問題:點在球麵多邊形內的位置判定,這既是全球地理分析中的必要環節,也是解決該問題的關鍵所在。由於球麵是非歐空間,這導致計算過程更為複雜,從而嚴重影響判定速度。相比投影、經緯度網格等方法,使用六邊形網格來判定點的空間位置是一個可能的途徑。為此,必威精装版app西汉姆联 白明研究組和中國科學院軟件研究所王文成研究員提出一種基於六邊形的自適應層次網格結構和球麵信息點的判定方法,該方法可以很好地處理球麵的非歐空間約束,從而提高點向多邊形的檢測效率。
同時,這種自適應層次結構的構建麵臨許多挑戰:任務負載、動態內存分配和數據依賴與同步。因此,該研究又進一步提出使用GPU並行計算來實現高效的(Adaptive Hexagonal Hierarchical Grid, AHHG)構建。相比於類似的球麵網格劃分方法,該方法大幅降低計算開銷,並且可以更穩定而高效地處理動態變化的情況。
該方法可以很好地應用於生物多樣性研究中,可以顯著提高運算效率和穩定性。例如,在基於AHHG構建的球麵體中,從約1.5億個甲蟲地理標點數據集過濾並可視化240萬北美甲蟲標本地理標點信息僅需95毫秒,比此前Ketzner等人提出的算法(Ketzner et al, 2022 Computers & Geosciences)快了877倍。
依據白明研究組與海關係統正在合作的關口前移有害生物監測技術,項目組計劃在遠洋貨輪上布設智能監測裝備,從而可以精準探明貨輪在不同國家地區監測到的有害生物,為避免國際糾紛提供科學支撐。然而貨輪在地球上的精準實時害蟲風險預測尚存在一定困難。本研究基於5艘移動的貨船在大西洋的航行軌跡和約100萬個害蟲的動態分布點,平均每幀運行時間為23毫秒,實現了實時監控害蟲風險。同時本研究對於邊界不斷變化的自然區域,點的判定速度也比其他最新優化算法效率更高,比如可以適合於洪水發展和消退過程中邊界的快速追蹤、昆蟲遷飛區域識別、戰棋推演等方麵。總之,該技術為地理大數據快速呈現領域提供了目前世界最快的解決方案,對於理論研究、行業應用、可持續發展、美麗中國、健康中國等方麵具有重要支撐作用。
此前,白明研究團隊還創製保存高質量DNA的昆蟲野外監測裝置WET(Lee et al., 2023 Methods in Ecology and Evolution)、開發表型編碼網絡PENet(Zhao et al., 2023 Methods in Ecology and Evolution)。結合本研究提出的使用GPUs創建六邊形自適應層次網格,它們從昆蟲標本的采集和高質量監測、表型數據提取和表征、地理大數據的處理等方麵提供一係列高效的新工具和方法,全麵助力下一代生物分類學發展。
該研究成果以Hexagon-based Adaptive Hierarchies for Effcient Point-in-Spherical-Polygon Tests on GPUs為題,於北京時間2023年11月30日在線發表於《國際地理信息科學雜誌》(International Journal of Geographical Information Science TGIS)。必威精装版app西汉姆联 工程師李靜為第一和論文通訊作者,動物所白明研究員和軟件所王文成研究員為高級作者。這項工作得到科技部國家重點研發計劃、國家自然科學基金委、國家科技基礎資源調查項目、東北亞生物多樣性研究中心等項目資助。
論文鏈接:https://doi.org/10.1080/13658816.2023.2284908
圖1. 使用GPU構建六邊形自適應層次網格(AHHG)的工作流程圖
圖2. AHHG的工作原理
圖3. 三個AHHG應用實例的截圖,視頻地址http://beetle.ioz.ac.cn/GAHHG.mp4
人類活動和氣候變化加速生物多樣性的減少,導致物種範圍的轉移、收縮和擴張。在全球範圍內,人類活動和氣候變化已對生物多樣性構成了嚴重威脅,目前已導致全球522種靈長類動物中約68%的物種麵臨滅絕風險。
植物病毒素有“植物頑疾”之稱,每年引起全球作物經濟損失高達4000億元。水稻作為人類重要的糧食作物之一,供給全世界一半以上的人口,主要種植於亞洲、非洲和南美洲等地區。