what is big data
بیگ دیتا چیست و چگونه از آن ها استفاده کنید؟
سه شنبه, ۲۹ تیر , ۱۴۰۰

کلان داده ها یا بیگ دیتا (Big Data) اصطلاحی است که برای توصیف حجم زیادی از داده‌ها استفاده می‌شود. این حجم از داده‌ها، چه ساخت یافته و چه ساخت نایافته، هر روز کسب وکار شما را اشباع می‌کنند. اما حجم داده‌ها مهم نیست؛ کاری که سازمان‌ها با این داده‌ها انجام می‌دهند مهم است. کلان داده ها را می‌توان برای بینش‌هایی که منجر به تصمیم گیری بهتر و حرکت‌های استراتژیک تجاری می‌شوند، تجزیه و تحلیل کرد.

 

اصطلاح “بیگ دیتا” به داده‌هایی گفته می‌شود که بسیار حجیم یا پیچیده هستند و پردازش آن‌ها با استفاده از روش‌های سنتی دشوار یا غیرممکن است. مدت هاست که ذخیره اطلاعات برای تجزیه و تحلیل آن‌ها انجام می‌شود. اما مفهوم کلان داده‌ها در اوایل دهه ۲۰۰۰ به وجود آمد، زمانی که داگ لانی، تحلیل کسب و کار، Big Data را با سه V تعریف کرد:

  1. حجم داده‌ها (Volume): سازمان‌ها داده‌ها را از منابع مختلفی از جمله معاملات تجاری، دستگاه‌های هوشمند، اینترنت اشیا، تجهیزات صنعتی، فیلم‌ها، شبکه‌های اجتماعی و غیره جمع آوری می‌کنند. در گذشته، ذخیره‌سازی این داده‌ها یک مشکل بزرگ بود، اما ظهور پلتفرم‌هایی مانند دریاچه داده‌ها (Data Lake) و Hadoop، این بار را کاهش داده است.
  2. سرعت تولید داده‌ها (Velocity): با رشد اینترنت اشیا، داده‌ها با سرعتی بی‌سابقه در کسب و کارها جریان پیدا می‌کنند و باید به موقع به آن‌ها رسیدگی شود. برچسب‌های RFID، سنسورها و کنتورهای هوشمند این الزام را ایجاد می‌کنند که به موقع و در فواصل زمانی کوتاه به این سیل داده‌ها رسیدگی شود.
  3. تنوع داده‌ها (Variety): داده‌ها در انواع فرمت‌ها وجود دارند، از داده‌های عددی ساخت یافته در پایگاه‌های داده سنتی گرفته تا فایل‌های متنی ساخت نایافته مثل ایمیل‌ها، ویدیوها، عکس‌ها، فایل‌های صوتی، داده‌های مربوط به سهام و معاملات مالی.


مدل 3 v برای بیگ دیتا یا کلان داده ها

چرا بیگ دیتا مهم است؟

اهمیت بیگ دیتا به حجم داده‌های شما نیست، بلکه به آنچه شما با آن انجام می‌دهید بستگی دارد. می‌توانید داده‌ها را از هر منبعی استخراج و آنها را تجزیه و تحلیل کنید تا پاسخ‌هایی را پیدا کنید که باعث ۱) کاهش هزینه، ۲) کاهش زمان، ۳) توسعه محصول جدید و پیشنهادات بهینه شده و ۴) تصمیم گیری هوشمند می‌شوند. وقتی بیگ دیتا را با تجزیه و تحلیل‌های پرقدرت ترکیب می‌کنید، می‌توانید فرآیندهای متنوع کسب و کار را به انجام برسانید مانند:

 

  • تشخیص به موقع علل اصلی شکست‌ها، مشکلات و نقص‌های فرآیندها
  • تولید کد تخفیف مختص هر مشتری در نقطه فروش بر اساس عادت خرید مشتری
  • محاسبه مجدد کل ریسک پرتفوها در چند دقیقه
  • تشخیص رفتارهای متقلبانه قبل از اینکه بر سازمان شما تأثیر بگذارد

چطور از بیگ دیتا استفاده کنیم؟

قبل از اینکه کسب وکارها بتوانند کلان داده ها را به کار بگیرند، باید نحوه جریان آن را در مکان‌ها، منابع، سیستم‌ها، مالکان و کاربران مختلف درک کنند. این “ساختار داده” بزرگ شامل داده‌های سنتی، ساخت‌ یافته همراه با داده‌های غیر ساختاری و نیمه ساختاری است که پنج مرحله اصلی برای به استفاده از آن وجود دارد.

۵ مرحله استفاده از بیگ دیتا

۱. یک استراتژی برای کلان داده هایتان تنظیم کنید

۲. منابع کلان داده ها را شناسایی کنید

داده‌های جریان یافته:

داده هایی هستند که از اینترنت اشیا (IOT) و سایر دستگاه‌های متصل به سیستم‌های IT از مثل تجهیزات پوشیدنی، ماشین‌های هوشمند، تجهیزات پزشکی، تجهیزات صنعتی و سایر موارد وارد می شود. می توانید این کلان داده‌ها را پس از ایجاد شدن، تجزیه وتحلیل کنید و تصمیم بگیرید که کدام داده‌ها را نگه دارید یا نگه ندارید، و کدامیک نیاز به تجزیه وتحلیل بیشتر دارند.

 

داده‌های شبکه‌های اجتماعی:

داده‌ها از تعاملات موجود در فیس بوک، یوتیوب، اینستاگرام و غیره سرچشمه می گیرند. این شامل حجم عظیمی از بیگ دیتا است که به صورت تصاویر، فیلم‌ها، صدا و متن است. تحلیل این کلان داده‌ها برای بهبود فرآیندهای بازاریابی، فروش و پشتیبانی مفید است.

 

داده‌هایی که برای عموم در دسترس هستند:

این کلان داده ها، داده‌هایی هستند که ار منابع دولتی، Fact book جهانی سازمان CIA و پرتال داده‌های عمومی اتحادیه اروپا به دست می‌آیند.

 

سایر کلان داده ها:

این کلان داده ها ممکن است از دریاچه داده (Data lake)، منابع داده‌ای ابری، تأمین کنندگان و مشتریان حاصل شوند.

۳. به داده‌ها دسترسی داشته باشید، آن ها را مدیریت و ذخیره کنید.

۴. داده ها را تجزیه و تحلیل کنید.

۵. تصمیمات داده محور بگیرید.

نام نویسنده:
به اشتراک بگذارید:
نمودار
مرجع رسمی هوش تجاری و علم داده | نمودار اولین مرجع تخصصی Power BI
مقالات مرتبط
چهار مرحله مدل بلوغ داده
چهار مرحله مدل بلوغ داده
تصمیم‌گیری‌های ضعیف گاها منجر به خسارت‌های بزرگی برای سازمان‌ها می‌شوند. شرکت‌هایی که منابع داده زیادی دارند، جریان‌های داده‌ای جدیدی ایجاد می‌کنند و دیتاست‌های موجود را به شکل‌های جدیدی طراحی می‌کنند. این شرکت‌ها از تحلیل‌هایی استفاده می‌کنند که در نهایت تصمیم‌گیری‌ها بهتر انجام شوند. با ظهور مواردی مثل ساختارهای داده‌ای حافظه‌دار (in memory)، سیستم‌های ذخیره‌ای که [...]
تصمیم گیری داده محور
چگونه تصمیم گیری داده محور بهتری داشته باشیم؟
با توجه به حجم روز افزون داه ها، اهمیت تصمیم گیری داده محور بر کسی پوشیده نیست. در این مقاله در مورد چرایی استفاده از Data Driven Decision Making  صحبت کردیم. در ادامه این مطلب قصد داریم ۱۰ راهکار عملی برای انجام بهتر تصمیم گیری داده محور در کسب و کار به شما پیشنهاد کنیم.  [...]
نظرات