ظهور علم داده به عنوان یک رشته و ابزار کاربردی در سالهای اخیر سبب پیشرفت تکنولوژیهایی مانند یادگیری عمیق ، پردازش زبان طبیعی و بینایی کامپیوتر شده است. از منظر دیگر ، علم داده به ظهور یادگیری ماشین به عنوان بخشی از هوش مصنوعی که در زندگی ما تغییرات شگرفی ایجاد کرده است نیز کمک شایانی نموده است.

علم داده ، کاربرد تئوری و عملی مواردی مانند ، کلان داده ، تحلیل های پیشگویانه و هوش مصنوعی را در برمی گیرد. اگر داده را سوخت عصر تکنولوژی و یادگیری ماشین را موتور آن بنامیم ، در آن صورت علم داده به مثابه قوانین فیزیک است که باعث احتراق و حرکت خواهد شد.  نکته ای که باید به خاطر سپرد آن است که هر چه درک از کار با داده ها رشد بیشتری داشته ، دانش نفهته در آن نیز دسترس پذیرتر شده است.

ده سال پیش ، علم داده موضوعی متشکل از آمار، ریاضیات و محاسبات بود که عموما در دانشگاه ها تدریس می شد اما در کسب و کار امروز به خوبی جای خود را باز کرده است و مسیرهای مختلفی مانند دوره های آنلاین ، آموزش های در حین کار و … افراد را به این دانش مجهز می نماید. تمامی این موضوعات سبب شده که بحث ” دموکراتیزه کردن علم داده” اهمیت بیشتری بیابد و چنانکه در ادامه شرح داده خواهد شد ، تاثیر آنها را در سال ۲۰۲۲ و سالهای پیش رو خواهیم دید.

داده های کوچک و یادگیری ماشین کوچک (Small Data and TinyML)

رشد سرسام آور داده های دیجیتالی که تولید ، جمع آوری و تحلیل می کنیم معمولا کلان داده نامیده میشوند. در حقیقت این واژه به معنای داده های بزرگ نیست ، گرچه الگوریتم های یادگیری ماشینی که معمولا برای پردازش آنها استفاده می کنیم بسیار بزرگ هستند. GPT-3 بزرگترین و پیچیده ترین سیستمی که قادر است زبان انسان را مدل سازی کند ، چیزی حدود ۱۷۵ بیلیون پارامتر دارد.

این برای زمانی مناسب است که بر روی سیستم ابری با پهنای باند نامحدود کار کنید. به همین دلیل مفهوم داده های کوچک شکل گرفت تا تحلیل های تشخیصی سریعِ بسیاری از داده های حیاتی را در شرایطی که زمان ، پهنای باند یا مصرف انرژی اهمیت فراوانی دارند ، تسهیل نماید. این مفهوم ارتباط مستقیمی با رایانش مرزی دارد. برای مثال نمی توان به ماشین های بدون سرنشین در مورد ارسال و دریافت داده از یک سرور ابری مرکزی ، هنگام اجتناب از ترافیک ناشی از تصادف در شرایط اضطراری اعتماد کرد.

یادگیری ماشین کوچک به الگوریتم های یادگیری ماشینی اطلاق می شود که فضای بسیار بسیار کمی را اشغال می کنند بنابراین می توانند بر روی سخت افزارهای کم قدرت نیز اجرا شوند. در سال ۲۰۲۲ ، شاهد حضور این تکنولوژی در تعداد بسیار زیادی از سیستم ها ، از پوشاک تا لوازم خانگی ، ماشین ها ، تجهیزات صنعتی ، ماشین آلات کشاورزی خواهیم بود که آنها را هوشمندتر و کاربردی تر خواهد نمود.

تجربه ی مشتری داده محور (Data-driven Customer Experience)

این تکنولوژی در حقیقت بر این اساس پایه گذاری شده است که چگونه کسب و کارها می توانند با استفاده از داده های ما ، تجربه ی دلپذیرتر و ارزشمندتری ایجاد کنند. این تجربه می تواند طراحی رابط کاربرپسند برای نرم افزار ، کاهش زمان جابجایی مشتری میان دپارتمان های مختلف در بخش خدمات مشتریان ،  یا کاهش تعارضات در فضای کسب و کار باشد.

تعاملات ما با کسب و کار روز به روز دیجیتالی تر می شود – از چت بات های هوش مصنوعی گرفته تا فروشگاه های بدون صندوق دار آمازون – به منظور کسب بینش از داده های ما برای خلق تجربه ی بهتر ایجاد شده اند. این رویکرد هم چنین سبب شخصی سازی بیشتر محصولات و خدماتی شده که توسط کسب و کارها عرضه می گردد. پاندمی کرونا ما را به سوی دریافت خدمات از فروشگاه های خرده فروشی آنلاین سوق داده است. یافتن متدها و استراتژی های جدید برای به کارگیری داده های مشتریان جهت خلق تجربه ی بهتر برای آنها ، نقطه ی تمرکز بسیاری از متخصصان حوزه ی علم داده در سال ۲۰۲۲ خواهد بود.

دیپ فیک ، هوش مصنوعی مولد و داده ی مصنوعی (Deepfakes, generative AI, and synthetic data)

امسال بسیاری از ما با ویدیوی منتشر شده از تام کروز در تیک تاک که از تکنولوژی دیپ فیک در آن استفاده کرده بود ، فریب خوردیم. تکنولوژی نهفته در آن در واقع هوش مصنوعی مولد است که هدف آن خلق یا ایجاد چیزی است  مانند مثال تام کروز که ما را با ملاقات با گورباچف سرگرم کرده بود در حالی که در واقعیت این اتفاق نیفتاده بود. هوش مصنوعی مولد ، خیلی زود در هنر و صنعت سرگرمی نیز جای خود را باز کرد، جایی که مارتین اسکورسیزی با استفاده از این تکنولوژی رابرت دنیرو در فیلم آیریشمن را جوان ساخت. در سال ۲۰۲۲ ، شاهد گسترش این تکنولوژی در بخش های دیگر خواهیم بود. برای مثال ، این تکنولوژی پتانسیل بسیاری برای ایجاد داده ی مصنوعی هنگام آموزش الگوریتم های یادگیری ماشین دارد. چهره های ساختگی افرادی که هرگز وجود خارجی ندارند برای آموزش الگوریتم های تشخیص چهره بدون نگرانی در مورد حفظ حریم خصوصی افراد مورد استفاده قرار خواهند گرفت. هم چنین می توانند برای آموزش سیستم های تشخیص تصویر در درمان سرطان های بسیار نادر نیز می توانند به کار روند.

هم گرایی (Convergence)

هوش مصنوعی ، اینترنت اشیا ، محاسبات ابری و شبکه های فوق سریع مانند ۵G ، سنگ بنای تحول دیجیتال می باشد ، و داده ها سوختی هستند که در جهت حصول نتیجه به کار گرفته می شوند. تمامی این تکنولوژی ها به طور جداگانه وجود دارند اما در صورتی که با یکدیگر ترکیب شوند ، یکدیگر را تقویت می کنند. هوش مصنوعی اینترنت اشیا را قادر به هوشمندانه تر عمل کردن می کند و موجی از خودکارسازی و ایجاد خانه های هوشمند ، کارخانه های هوشمند و در نتیجه های شهرهای هوشمند را به ارمغان می آورد. الگوریتم های هوش مصنوعی که توسط متخصصان علم داده ایجاد می شوند نقش کلیدی را بازی می کنند.

در سال ۲۰۲۲ بسیاری از کارهای جذاب در حوزه ی علم داده ، از طریق تلاقی این تکنولوژی ها اتفاق می افتند. این تکنولوژی ها همدیگر را تقویت و به خوبی با یکدیگر کار می کنند.

یادگیری ماشین خودکار (AutoML)

AutoML خلاصه ی واژه ی یادگیری ماشین خودکار (Automated Machine Learning) یک ترند بسیار جذاب است که بحث دموکراتیزه کردن  علم داده که در مقدمه نیز ذکر شد را نیز شامل می شود. برنامه نویسان راهکار یادگیری ماشین خودکار قصد دارند پلتفرم ها و ابزارهایی ایجاد کنند تا تمامی افراد بتوانند برای ایجاد اپلیکیشن های یادگیری ماشین خودکار خود از آن استفاده نمایند.

اغلب بخش عمده ای از زمان دانشمندان علم داده ، صرف پالایش داده ها و آماده سازی می شود – فعالیت هایی که به تخصص در علم داده نیاز دارد و روتین و معمولی است – یادگیری ماشین خودکار در پایه ای ترین سطح خود ، خودکار سازی این فعالیت ها را شامل می شود و در واقع به معنای ساخت مدل ها و ایجاد الگوریتم ها و شبکه های عصبی است. هدف آن است که هر فردی که نیاز به حل مشکل یا تست ایده های خود دارد قادر به استفاده از الگوریتم های یادگیری ماشین از طریق رابط کاربری ساده و کاربرپسند برای یافتن راهکار باشد. سال ۲۰۲۲ گام بزرگتری به این سمت این تکنولوژی خواهد برداشت.

منبع