تشخیص خودکار سیگنال لرزه‌ای با استفاده از روش خوشه‌بندی K_Means

عنوان دوره: بیستمین کنفرانس ژئوفیزیک ایران

کد مقاله : 1988-NIGS

نویسندگان

¹موسسه ژئوفیزیک دانشگاه تهران

²؛ موسسه ژئوفیزیک دانشگاه تهران، دانشگاه تهران

چکیده

برداشت داده‌های لرزه‌ای همواره با نوفه‌ همراه است. در پاره‌ای از کاربردها در پردازش و تفسیر داده‌های لرزه‌ای لازم است محل سیگنال درداده آلوده به نوفه شناسایی گردد. در این مقاله الگوریتم خوشه‌بندی کی-میانگین جهت تشخیص خودکار داده از نوفه استفاده‌شده است. این ‌الگوریتم یکی از روش‌های یادگیری ماشین غیر نظارتی هست. در این روش مجموعه داده‌ها با استفاده از چهار نشانگر به دو گروه سیگنال و غیر سیگنال تقسیم‌بندی می‌شوند. در این مقاله چهار پارامتر نسبت انرژی میانگین در پنجره کوتاه‌مدت به بلندمدت پیشرو، نسبت انرژی میانگین کوتاه‌مدت به بلندمدت پس‌رو، همپوشانی و پنجره متحرک واریانس به‌عنوان نشانگر جهت خوشه‌بندی سیگنال و از الگوریتم لوید برای خوشه‌بندی کی-میانگین استفاده‌شده است. برای برآورد کارایی الگوریتم تشخیص سیگنال لرزه‌ای، دو شاخص آماری یعنی نرخ بین انرژی کل سیگنال‌های اصلی و شناسایی‌شده (RTE) و نرخ بین انرژی‌های متوسط سیگنال‌های اصلی و شناسایی‌شده پیشنهاد می‌شود. عملکرد روش روی‌داده‌های مصنوعی ارزیابی و نتایج ارائه می‌شود.

کلیدواژه ها

خوشه‌بندی؛ یادگیری ماشین؛ نشانگر؛ پنجره‌ی واریانس؛ نسبت انرژی پنجره‌ی کوتاه مدت به بلند مدت

Title

Seismic Signal Recognition by K-Means Clustering

Authors

Amir Jamasb, Hamidreza Siahkoohi

Abstract

Seismic signal recognition can serve as a powerful auxiliary tool for analyzing and processing ever-larger volumes of seismic data. It can facilitate many subsequent procedures such as first-break picking, statics correction, denoising, signal detection, events tracking, structural interpretation, inversion and imaging. In this study, we propose an automatic technique of seismic signal recognition taking advantages of unsupervised machine learning. In the proposed technique, seismic signal recognition is considered as a problem of clustering data points. All the seismic sampling points in time domain are clustered into two clusters, that is, signal or non-signal. The K-Means clustering algorithm is used to group these sampling points. Four attributes, that is, two STA/LTA ratios, variance and envelope are investigated in the clustering process. The performances of the method are tested on synthetic data and results are presented.

Keywords

k-means clustering, STA/LTA, Attribute domain, Moving Variance, Envelope, machine learning