کلان داده ها یا بیگ دیتا (Big Data) اصطلاحی است که برای توصیف حجم زیادی از داده‌ها استفاده می‌شود. این حجم از داده‌ها، چه ساخت یافته و چه ساخت نایافته، هر روز کسب وکار شما را اشباع می‌کنند. اما حجم داده‌ها مهم نیست؛ کاری که سازمان‌ها با این داده‌ها انجام می‌دهند مهم است. کلان داده ها را می‌توان برای بینش‌هایی که منجر به تصمیم گیری بهتر و حرکت‌های استراتژیک تجاری می‌شوند، تجزیه و تحلیل کرد.

اصطلاح “بیگ دیتا” به داده‌هایی گفته می‌شود که بسیار حجیم یا پیچیده هستند و پردازش آن‌ها با استفاده از روش‌های سنتی دشوار یا غیرممکن است. مدت هاست که ذخیره اطلاعات برای تجزیه و تحلیل آن‌ها انجام می‌شود. اما مفهوم کلان داده‌ها در اوایل دهه ۲۰۰۰ به وجود آمد، زمانی که داگ لانی، تحلیل کسب و کار، Big Data را با سه V تعریف کرد:[/vc_column_text][vc_column_text]

  1. حجم داده‌ها (Volume): سازمان‌ها داده‌ها را از منابع مختلفی از جمله معاملات تجاری، دستگاه‌های هوشمند، اینترنت اشیا، تجهیزات صنعتی، فیلم‌ها، شبکه‌های اجتماعی و غیره جمع آوری می‌کنند. در گذشته، ذخیره‌سازی این داده‌ها یک مشکل بزرگ بود، اما ظهور پلتفرم‌هایی مانند دریاچه داده‌ها (Data Lake) و Hadoop، این بار را کاهش داده است.
  2. سرعت تولید داده‌ها (Velocity): با رشد اینترنت اشیا، داده‌ها با سرعتی بی‌سابقه در کسب و کارها جریان پیدا می‌کنند و باید به موقع به آن‌ها رسیدگی شود. برچسب‌های RFID، سنسورها و کنتورهای هوشمند این الزام را ایجاد می‌کنند که به موقع و در فواصل زمانی کوتاه به این سیل داده‌ها رسیدگی شود.
  3. تنوع داده‌ها (Variety): داده‌ها در انواع فرمت‌ها وجود دارند، از داده‌های عددی ساخت یافته در پایگاه‌های داده سنتی گرفته تا فایل‌های متنی ساخت نایافته مثل ایمیل‌ها، ویدیوها، عکس‌ها، فایل‌های صوتی، داده‌های مربوط به سهام و معاملات مالی.
مدل 3 v برای بیگ دیتا یا کلان داده ها

اهمیت بیگ دیتا به حجم داده‌های شما نیست، بلکه به آنچه شما با آن انجام می‌دهید بستگی دارد. می‌توانید داده‌ها را از هر منبعی استخراج و آنها را تجزیه و تحلیل کنید تا پاسخ‌هایی را پیدا کنید که باعث ۱) کاهش هزینه، ۲) کاهش زمان، ۳) توسعه محصول جدید و پیشنهادات بهینه شده و ۴) تصمیم گیری هوشمند می‌شوند. وقتی بیگ دیتا را با تجزیه و تحلیل‌های پرقدرت ترکیب می‌کنید، می‌توانید فرآیندهای متنوع کسب و کار را به انجام برسانید مانند:

 

  • تشخیص به موقع علل اصلی شکست‌ها، مشکلات و نقص‌های فرآیندها
  • تولید کد تخفیف مختص هر مشتری در نقطه فروش بر اساس عادت خرید مشتری
  • محاسبه مجدد کل ریسک پرتفوها در چند دقیقه
  • تشخیص رفتارهای متقلبانه قبل از اینکه بر سازمان شما تأثیر بگذارد

قبل از اینکه کسب وکارها بتوانند کلان داده ها را به کار بگیرند، باید نحوه جریان آن را در مکان‌ها، منابع، سیستم‌ها، مالکان و کاربران مختلف درک کنند. این “ساختار داده” بزرگ شامل داده‌های سنتی، ساخت‌ یافته همراه با داده‌های غیر ساختاری و نیمه ساختاری است که پنج مرحله اصلی برای به استفاده از آن وجود دارد.

داده‌های جریان یافته:

داده هایی هستند که از اینترنت اشیا (IOT) و سایر دستگاه‌های متصل به سیستم‌های IT از مثل تجهیزات پوشیدنی، ماشین‌های هوشمند، تجهیزات پزشکی، تجهیزات صنعتی و سایر موارد وارد می شود. می توانید این کلان داده‌ها را پس از ایجاد شدن، تجزیه وتحلیل کنید و تصمیم بگیرید که کدام داده‌ها را نگه دارید یا نگه ندارید، و کدامیک نیاز به تجزیه وتحلیل بیشتر دارند.

 

داده‌های شبکه‌های اجتماعی:

داده‌ها از تعاملات موجود در فیس بوک، یوتیوب، اینستاگرام و غیره سرچشمه می گیرند. این شامل حجم عظیمی از بیگ دیتا است که به صورت تصاویر، فیلم‌ها، صدا و متن است. تحلیل این کلان داده‌ها برای بهبود فرآیندهای بازاریابی، فروش و پشتیبانی مفید است.

 

داده‌هایی که برای عموم در دسترس هستند:

این کلان داده ها، داده‌هایی هستند که ار منابع دولتی، Fact book جهانی سازمان CIA و پرتال داده‌های عمومی اتحادیه اروپا به دست می‌آیند.

 

سایر کلان داده ها:

این کلان داده ها ممکن است از دریاچه داده (Data lake)، منابع داده‌ای ابری، تأمین کنندگان و مشتریان حاصل شوند.[/vc_column_text][vc_empty_space][vc_custom_heading text=”3. به داده‌ها دسترسی داشته باشید، آن ها را مدیریت و ذخیره کنید.