1

وب کاوی چیست؟ در این نوشتار آموزشی قصد داریم درباره وب‌کاوی، انواع آن و ارتباطی که با داده‌کاوی دارد صحبت کنیم. تا انتها با ما همراه باشید.

بیشتر بخوانید: داده کاوی چیست؟

وب کاوی فرآیند استفاده از تکنیک‌ها و الگوریتم‌های داده کاوی برای استخراج مستقیم اطلاعات از وب به عنوان منبع اصلی داده است.

داده‌های استخراج شده از وب شامل اسناد و خدمات وب، محتوای وب، لینک‌ها و گزارش‌های سرور است.

وب‌کاوی با استفاده از خزنده‌های وب انجام می‌شود.

هدف خزش وب نیز جستجوی الگوها در داده‌های وب به‌منظور جمع‌آوری و تجزیه‌وتحلیل اطلاعات است.

بیشتر بخوانید: خزش وب چیست و چگونه کار می‌کند؟

داده کاوی تحت وب

داده‌کاوی تحت وب شاخه‌ای از داده‌کاوی است که بر شبکه جهانی وب و تمام اجزای آن، (از گزارش‌های سرور گرفته تا بقیه چیزها) به‌عنوان منبع اصلی داده، تمرکز دارد. محتوای داده‌های استخراج‌شده از وب، مجموعه‌ای از اطلاعات است که از صفحات وب منشأ می‌گیرد و شامل متن، فهرست‌ها و حتی تصاویر، ویدئوها و صدا باشند.

کاربردهای وب کاوی در رشته‌های گوناگون

۱. وب‌کاوی با طبقه‌بندی اسناد و شناسایی صفحات وب به بهبود قدرت موتور جستجوی وب کمک می‌کند.

۲. وب‌کاوی همان‌طور که از نامش پیداست به جستجوی وب مربوط است و با ابزارهایی مانند: گوگل، یاهو، Fatlens، Become سروکار دارد.

۳. درک و پیش‌بینی رفتار کاربران (قابل‌استفاده در دیجیتال مارکتینگ و هوش تجاری)

این مطلب را نیز حتما بخوانید:  فرآیند در رایانش چیست؟

۴. انواع آنالیز و بهینه‌سازی در بخش‌های مختلف مانند محتوا، سایت صفحه فرود (Landing Page)، شبکه‌های اجتماعی و … .

۵. استفاده در جستجوی اطلاعات منبع‌باز در وب یا اوسینت (OsInt)

دسته بندی وب کاوی

وب‌کاوی سه دسته‌بندی مهم دارد که عبارت است از:

کاوش محتوای وب

این فرایند شامل استخراج اطلاعات مفید از محتوای صفحات وب و اسناد وب است که عمدتاً متن، تصاویر و فایل‌های صوتی و تصویری هستند. تکنیک‌های مورداستفاده در این رشته از پردازش زبان طبیعی (NLP) و بازیابی اطلاعات استخراج شده است.

بیشتر بخوانید: پردازش زبان طبیعی (NLP) در داده کاوی چیست؟

کاوش ساختار وب

فرایند تجزیه‌وتحلیل گره‌ها و ساختار اتصال یک وب‌سایت بر اساس نظریه گراف است. دو چیز را می‌توان از این موضوع به دست آورد: چگونگی ارتباطات یک وب‌سایت با سایت‌های دیگر و ساختار  وب‌سایت از نظر اتصال به صفحات داخلی.

کاوش استفاده از وب

فرایند استخراج الگوها و اطلاعات از گزارش‌های سرور برای به‌دست‌آوردن دیدگاه در مورد فعالیت کاربر است، از جمله این‌که کاربران از کجا آمده‌اند، و نیز اطلاعاتی از قبیل میزان کلیک روی لینک‌ها و انواع فعالیت‌های انجام شده در سایت.

در این مقاله درباره این‌که وب کاوی چیست مطالبی آموختیم. با تشکر از همراهی شما.

منابع

۱. تعریف وب کاوی – ترجمه از انگلیسی

۲. تعریف وب کاوی – ترجمه از انگلیسی

مطالب مرتبط
1
1 دقیقه

انواع هوش تهدید چیست؟

golearnwork

انواع هوش تهدید چیست؟ در این نوشتار آموزشی بر آن شدیم که درباره انواع هوش تهدید مباحثی را مطرح کنیم. با ما همراه باشید. نوشتار اصلی: هوش تهدید چیست؟ همان‌طور که در بحث چرخه حیات هوش تهدید دیدیم، محصول نهایی بسته به نیازهای اولیه اطلاعاتی، منابع اطلاعات و مخاطبان مورد نظر متفاوت خواهد بود. تقسیم […]

1 دقیقه

Nmap چیست؟

golearnwork

Nmap چیست؟ چه ابزاری است و چه کاربردی دارد؟ کاربرد آن در کالی لینوکس چگونه است؟ در این بخش با ما همراه باشید. ابزار Nmap چیست؟ برنامه Network Mapper ، که به اختصار به عنوان Nmap شناخته می‌شود ، یک ابزار رایگان و منبع باز است که برای جستجوی آسیب‌پذیری‌ها در شبکه و تجزیه و […]

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

سبد خرید
Subtotal 0 تومان