عنوان کتاب : Bad Data Handbook
نویسنده : Q. Ethan McCallum
سال انتشار : ۲۰۱۳
ناشر : O’Reilly
مشخصات کتاب
داده بد (bad data) چیست؟
عدهای بر این باور هستند که داده های بد، رکوردهایی میباشند که شامل دادههای مفقود (missing value) یا دادههای بدفرم (malformed) هستند. اما داده بد چیزی فراتر از اینهاست. که در این کتاب در مورد آن توضیح داده شده است.
با مطالعه این کتاب میتوانید:
- داده های خود را تست کنید و ببنید که آیا برای تحلیل آماده هستند.
- داده ها را به یک فرمت قابل استفاده تبدیل کنید.
- مشکلات کد زنی که در داده های متنی پنهان هستند، را برطرف کنید.
- یک مدل وب اسکرپینگ به صورت موفق توسعه دهید.
- از ابزارهای NLP بمنظور تحلیل احساسات (sentiment analysis) استفاده کنید.
- یک راهکار سیستمی برای تحلیل کیفیت داده ها ایجاد کنید.