داده بد (bad data) چیست؟

عده‌ای بر این باور هستند که داده های بد، رکوردهایی می‌باشند که شامل داده‌های مفقود (missing value) یا داده‌های بدفرم (malformed) هستند. اما داده بد چیزی فراتر از این‌هاست. که در این کتاب در مورد آن توضیح داده شده است.

با مطالعه این کتاب می‌توانید:

  • داده های خود را تست کنید و ببنید که آیا برای تحلیل آماده هستند.
  • داده ها را به یک فرمت قابل استفاده تبدیل کنید.
  • مشکلات کد زنی که در داده های متنی پنهان هستند، را برطرف کنید.
  • یک مدل وب اسکرپینگ به صورت موفق توسعه دهید.
  • از ابزارهای NLP بمنظور تحلیل احساسات (sentiment analysis) استفاده کنید.
  • یک راهکار سیستمی برای تحلیل کیفیت داده ها ایجاد کنید.