داده های ساختاریافته، نیمه ساختاریافته و ساختارنایافته و تفاوت آنها. در این مقاله قصد داریم دادهها را از دید ساختاریافته بودن مورد بررسی قرار دهیم.
بیشتر بخوانید: داده بزرگ چیست؟
داده بزرگ شامل حجم بسیار زیاد، سرعت بالا و تنوع قابل افزایش داده است. 3 نوع داده وجود دارد: داده های ساختاریافته، دادههای نیمهساختار یافته و دادههای بدون ساختار.
دادههای ساختاربافته
دادههای ساختاریافته دادههایی هستند که عناصر آن برای تجزیهوتحلیل کارآمد قابل آدرسدهی هستند. این دادهها در یک مخزن فرمت شده که معمولاً یک پایگاهداده است، سازماندهی شدهاند. دادههای ساختاریافته شامل تمام دادههایی است که میتوان آنها را در پایگاهداده SQL در یک جدول با ردیفها و ستونها ذخیره کرد. آنها کلیدهای رابطهای دارند و بهراحتی میتوان آنها را در فیلدهای از پیش تعریف شده ترسیم کرد. امروزه این دادهها عمدتاً برای توسعه و مدیریت اطلاعات پردازش میشوند. مثال: دادههای رابطهای
دادههای نیمه ساختاریافته
دادههای نیمه ساختاریافته اطلاعاتی هستند که در یک پایگاهداده رابطهای قرار نمیگیرند، اما دارای ویژگیهای سازمانی خاصی هستند که تجزیهوتحلیل آن را تسهیل میکند. البته ناگفته نماند که به کمک برخی فرایندها میتوان آنها را در پایگاهداده ذخیره کرد. (این کار میتواند برای برخی از انواع دادههای نیمهساختاریافته دشوار باشد.) انواعی از دادههای نیمهساختاریافته باهدف صرفهجویی در فضا وجود دارند. مثال: دادههای XML.
دادههای ساختارنایافته
دادههای ساختارنایافته انواعی از دادهها هستند که با روشی از پیش تعریف شده سازماندهی نشدهاند؛ بنابراین بههیچعنوان برای یک پایگاهداده رابطهای سنتی مناسب نیستند. برای این نوع از دادهها پلتفرمهای جایگزینی طراحی شده است که ذخیرهسازی و مدیریت آنها را ممکن میکند. دادههای ساختارنایافته به طور گسترده در سیستمهای کامپیوتری مورداستفاده قرار میگیرند. مثال:
Word، PDF، Text، Media Logs.
منابع
۱. بررسی انواع داده از نظر ساختار – ترجمه از انگلیسی
این مقاله برای من مفید بود
1+ 1 نفر این مقاله را پسندیده