نقش یادگیری ماشین در هوش تهدید؛ در این مقاله برآن شدهایم تا درباره ارتباط هوش تهدید و یادگیری ماشین صحبت کنیم. با ما همراه باشید.
نوشتار اصلی: هوش تهدید چیست؟
امروزه پردازش دادهها در مقیاسی انجام میشود که نیاز به اتوماسیون کامل دارد. ما مجبوریم نقاط داده را از انواع مختلف منابع، از جمله منابع باز، دارک وب و منابع تکنیکال ترکیب کنیم تا قویترین تصویرسازی ممکن و تجسم داده بهینه را ایجاد کنیم.
همچنین بخوانید: نقاط داده چیست؟ ، تجسم داده چیست؟
مراحل
۱. ساختاردهی دادهها به صورت موجودیتها و رویدادها
دانش هستیشناسی یا آنتولوژی، به نحوه تقسیم مفاهیم و نحوه گروهبندی آنها مربوط میشود. در علم داده، بررسیهای هستیشناختی، دستههایی از موجودیتها را بر اساس نامها، ویژگیها و روابطشان با یکدیگر نشان میدهند و مرتبسازی آنها را در قالب سلسلهمراتبی آسانتر میکنند. به عنوان مثال، بوستون، لندن و رم، همگی نهادهای جداگانهای هستند که تحت یک نهاد بزرگتر “شهر” نیز قرار میگیرند.
در حالی که موجودیتها وسیلهای برای مرتبسازی مفاهیم فیزیکی متمایز هستند، رویدادها مفاهیم را در طول زمان مرتب میکنند.
هستیشناسیها و رویدادها جستجوهای قدرتمندی را در بین دستهها امکانپذیر میکنند و به تحلیلگران اجازه میدهند تا به جای اینکه مجبور باشند خود دادهها را به صورت دستی مرتب کنند، روی تصویر بزرگ تمرکز کنند.
بیشتر بخوانید: داده های ساختاریافته، نیمه ساختاریافته و ساختارنایافته و تفاوت آنها
۲. ساختاردهی متن در چندین زبان با استفاده از پردازش زبان طبیعی
با پردازش زبان طبیعی، موجودیتها و رویدادها میتوانند فراتر از کلمات کلیدی ساده رفته و متن بدون ساختار را از منابع در زبانهای مختلف به یک پایگاه داده ساختاریافته تبدیل کنند.
یادگیری ماشین در ظهر این فرآیند میتواند تبلیغات را از محتوای اصلی جدا کند، متن را به دستههایی مانند نثر، گزارش دادهها یا کد طبقهبندی کند، و بین موجودیتهایی با همان نام ابهامزدایی کند، با استفاده از سرنخهای متنی در متن اطراف.
به این ترتیب، این سیستم میتواند روزانه متن میلیونها سند را به چند زبان مختلف تجزیهوتحلیل کند، کاری که به یک تیم بسیار بزرگ و ماهر از تحلیلگران انسانی نیاز دارد.
۳. برای طبقهبندی رویدادها و موجودیتها، به تحلیلگران انسانی کمک میکند تا هشدارها را اولویتبندی کنند
روششناسی آماری و یادگیری ماشین برای مرتبسازی بیشتر موجودیتها و رویدادها بر اساس اهمیت، مانند تخصیص امتیاز ریسک به موجودیتهای مخرب، استفاده میشود.
امتیازهای ریسک با استفاده از دو سیستم محاسبه میشوند: یکی بر اساس قوانین مبتنی بر شهود و تجربه انسانی، و دیگری بر اساس یادگیری ماشین که برای کار بر روی یک مجموعه داده از قبل تأیید شده آموزش دیده است.
طبقهبندیکنندههایی مانند امتیاز ریسک دو پارامتر را پشتیبانی میکنند:
۱. داوری (مثال: “این رویداد مهم است”)
۲. زمینه توضیح امتیاز را ارائه میکنند (مثال: “چندین منبع تایید میکنند که این آدرس IP مخرب است”).
طبقهبندی خودکار ریسک باعث صرفهجویی در وقت تحلیلگران میشود تا نتایج مثبت کاذب و تصمیمگیری اولویتها را تعیین کنند، و به کارکنان امنیت فناوری اطلاعات کمک میکند تا ۳۴ درصد زمان کمتری را برای جمعآوری گزارشها صرف کنند.
۴. پیشبینی رویدادها و ویژگیهای موجودیتها از طریق مدلهای پیشبینی
یادگیری ماشین همچنین میتواند مدلهایی تولید کند که آینده را پیشبینی میکنند، اغلب بسیار دقیقتر از هر تحلیلگر انسانی، که از مجموعهای از دادههای استخراجشده و طبقهبندیشده قبلی استفاده میکند.
این یک کاربرد بسیار قوی از “قانون اعداد بزرگ” در یادگیری ماشین است. همانطور که ما همچنان به منابع داده بیشتری دست میزنیم، این مدلهای پیشبینی به شکلی فزاینده دقیق میشوند.
در این مقاله درباره نقش یادگیری ماشین در هوش تهدید مطالبی را مطرح کردیم. با تشکر از همراهی و مطالعه شما عزیزان.
منابع
۱. یادگیری ماشین و هوش تهدید – ترجمه از انگلیسی
این مقاله برای من مفید بود
1+ 0 نفر این مقاله را پسندیده