Application of Data Science
Application of Data Science
یکی از سواالتی که هر شخصی در ابتدای فراگیر ی هر علمی از خود میپرسد این است که "آنچه میآموزم چه کاربردی
دارد و شغل من در آینده چه خواهد بود؟" .در این بخش برآنیم تا طیف گستردهای از موارد استفادهی علم داده را
بیان کنیم .شایان ذکر است که کاربردهای علم داده به قدر ی وسیع است که اکثر کارفرمایان و مالکین کسب و کار
اطالعی از اثرگذار ی و منفعت این علم در کسب کار خودشان ندارند .و برخی حتی از چیستی علم داده آگاهی ندارند.
پس یکی از وظایف دانشمند علم داده ارائهی مستندات و راه حلهای ملموس برای کارفرمایان و در نتیجه قانع کردن
آنهاست.
شاخه فروش:
تحلیل احساس " "Sentiment Analysisمبحثی بسیار گسترده است و امروزه در تحلیل اجتماع ،پیشبینی وقایع و
تحلیلهای پیچیده اجتماعی و سیاسی و پیش بینی آنها نقش مهمی ایفا میکند.
این مبحث یک باب نوین در علم نیست و سالهاست که درحال اجراست .اما با آمدن علم داده این کار با دقت
بسیار ز یادتر و در زمان کمتر ی انجام پذیر است .این بدین معنی است که دیگر نیاز ی به لیستهای نظر سنجی بلند
باال نیست که تقر یبا هیچگاه به نتیجه صحیح و بازخورد قابل استناد نمیرسد؛ چرا که مشتر یان عالقه به هز ینه کردن
زمان خود برای دادن بازخوردهای بلند باال ندارند و اگر آنها را با روشهای گوناگون و غیر مستقیم مجبور به پاسخ
دادن به سواالت کنیم ،از دستشان میدهیم .امروزه این کار با تحلیل کامنتها و الیکهای مشتر یان در فضای مجاز ی
یا در محلهایی که برای "انتقاد و پیشنهاد انتخابی" در نظر گرفته شده ممکن است.
صاحبان کسب و کار همیشه به دنبال تامین محصول و یا اقالم مناسب ،در زمان مناسب ،با کیفیت مناسب و قیمت
معقول هستند .داشن قیمت تمام شده معقول به عوامل ز یادی بستگی دارد .بخشی از آن به زمان و مقدار خر ید باز
میگردد و بخشی دیگر به پیشبینی تالطم بازار و پیشبینی نیاز مشتر یان در آینده .زمانی که حرف از پیشبینی ،کشف،
تشخیص و یا بهینه ساز ی بر اساس چندین پارامتر و قوانین پیچیده به میان میآید ،علم داده از اولین ابزارهای
کاربردی و راه بهینه برون رفت از سردرگمی و تصمیمات اشتباه است.
به این منظور فرآیندهای زنجیرهی تامین و وقایع آن در کنار تجربیات و ذکاوت ،منابع اصلی جمع آور ی دادههای ما
هستند .سپس روشهای آمار ی و الگور یتمهای مناسب برای یادگیر ی ماشین و همچنین رصد بازار و تغییرات آن ما
را در یافتن راه حلهای مناسب در این مسئله یار ی میدهد.
قطعا برای یکایک ما پیش آمده که از خر یدی به علت قیمت "نامتناسب" آن منصرف شده باشیم .بر اساس آمار
موجود جهانی ،سیاست قیمتگذار ی به علت پیچیده بودن و تعدد پارامترهای دخیل عمدتا به شکل ناقص تشخیص
داده و وضع میشوند .این موضوع یکی از دالیل اصلی کم شدن سود ساالنه معرفی شده است .گاهی یا بهتر است
بگوییم در اکثر مواقع به علت نامعقول بودن و باال بودن قیمت و در برخی دیگر از موارد به علت عدم سنخیت قیمت
پایین و یا باالی کاال با سطح کیفی مورد انتظار ،مشتر ی از خر ید کاال منصرف میشود و به دنبال کاالی جایگز ین
میرود .این دیدگاه از سمت خر یدار ،درکنار دیدگاه فروشنده که به دنبال افزایش مشتر ی و در عین حال حفظ سود
است ،چالشی جالب و رایج است.
پارامترها و شاخصهای گوناگونی در این مسئله دخیل اند و رسیدن به یک راه حل که بر حسب رویدادها و فصول
مختلف ،بهتر ین حالت فروش و رونق کسب را به همراه داشته باشد ،نیازمند تحلیلهای گوناگون است .رفتار خر یدار،
زمان خر ید ،قیمت خر ید اجناس از سمت فروشنده ،شرایط بازار ،رقابت ،بحرانها و موارد متعدد دیگر در رسیدن به
یک سلسله¬ی صحیح از تصمیمات و مجموعهای منعطف و قابل تطبیق از پارامترها و شاخصها ،نیازمند مجهز بودن
به علم داده است .این علم به ما امکانات حفظ مشتر ی با کمتر ین هز ینه را میدهد.
➢ آیا میدانید مقدار سود از دست رفته به علت اشتباه انتخاب در مکان کسب و کار شما چقدر است؟
➢ چقدر از این سود از دست رفته به علت عدم وجود مشتر یان مورد نظر شما در نزدیکی محل کسب شماست؟
➢ چه مقدار از ین سود از دست رفته به علت فاصلهی شما از مناطق اصلی ارائهی کاالی مورد نظر شماست؟
➢ چه مقدار از سود ازدست رفته به علت شلوغی بیش از حد و نبود جای پارک در محل فعلی کسب و کار
شماست؟
علم داده با توجه به انتخاب و نحوه تصمیم گیر ی مالکان کسب و کارهای مبتنی بر حضور مراجعین ،بهتر ین راه
تشخیص محل خر ید و یا ساخت شعب شناخته شده است .با یک دید فنی جهت تشخیص بهتر ین محل جغرافیایی،
دادههای فراوانی برای تحلیل و پردازش به نظر خواهد آمد.
راه حل این تشخیص ،ساده اما بسیار موثر است .با مطالعه دادههای بهروز مشتر یان ،اطالعات سرشمار ی و فراوانی
تعداد اشخاص در هر محله با درنظر گرفتن ساعات حضور افراد و نوع مشغلهی آنها میتوان به محل جغرافیایی
مناسبی که بیشتر ین پتانسیل را برای نوع کسب و کار مد نظرمان دارد ،دست یافت .در نظر گرفتن موقعیت مکانی
کسب و کارها با استفاده از دادههای موجود ،کارفرما را از سرمایهگذار ی اشتباه دور کرده و ایشان را به سمت بهینهتر ین
انتخاب محل سوق خواهد داد.
میدانیم که خدمات پس از فروش ،برای فردی که ضمانت میدهد کم و یا بی هز ینه نیست و بدیهی است که
تخلفاتی در این زمینه به فراخور بعضی پارامترها از جمله ارزش کاال شکل میگیرد .کشف این گونه تخلفات و تحلیل
کلیهی درخواستهای در یافت خدمات پس از فروش میتواند راهی برای بهینهساز ی در زمان ،هز ینه ،شهرت خدمات
دهنده و دیگر موارد باشد.
این دست از تحلیل و تشخیصها خیلی ساده شکل نمیگیرد و شامل مراحل نسبتا پیچیده مثل دسته بندی مشتر ی،
تحلیل صحت دسته بندی ،کاهش آالرم های اشتباه " ،"False Positiveتقویت خصیصههای ممیز ی ،ذکاوت و آگاهی
فرایندی و غیره می¬شود .همچنین از بعد فنی نیز پردازش متن ،داده کاوی کالسیک و آمار و احتماالت نیازمندیهای
این گونه پروژهها هستند.
این روش الزاما مختص کاالهای گران قیمت و یا با تعمیرات پر هز ینه نیستند .چرا که هز ینه پاسخگویی ،رسیدگی به
درخواستها ،حمل و نقل و برطرف کردن مشکل احتمالی هر کاالیی بخش ز یادی از هز ینه¬ی کسب و کارها بوده و
برای کارفرمایان قابل توجه است .با استفاده از علم داده میتوان هز ینههای رسیدگی به درخواستها را معطوف به
درخواست های مشکوک کرد و با توجه به شرایط ،آنها را رد و یا مرتفع کرد.
تحلیل سبد خر ید از سنتیتر ین و سادهتر ین مباحثی است که با علم داده بهینه شده است و شامل یادگیر ی از طر یق
روشهایی از جمله کشف رشته قوانین " "Rule Miningبه انجام میرسد .در این شاخه ،عالقهمندی و عدم عالقهمندی
و مجموعهای از محصوالتی که بیشتر ین احتمال خر یدار ی شدن را دارند قابل استخراج است .توابع وابستگی و قوانین
انجمنی ،عضوهای اصلی ساخت و یا کشف قوانین در این مسئله هستند .تولید محصوالت در صورت وجود دادهی
الزم در این گونه تحلیلها ممکن و شدنی است.
یکی از نکات چالشی در این گونه مسائل که عموما نادیده گرفته می-شود نحوهی سنجش نتایج نهایی قبل از ارائه به
کارفرماست .چرا که توابع سنجشی در اینگونه مسائل رفتار عجیبی دارند و ممکن است ما را به اشتباه ساده با تبعات
بسیار بزرگ مبتال کنند .دقت داشته باشیم که در تحلیل سبد خر ید ،اشتباهات ما به عنوان دانشمند داده میتواند در
مدت زمان کوتاهی آثار سوء خود را نشان دهند و سود نهایی کارفرما را کاهش دهند .بنابراین پیشنهاد میگردد علم
الزم در این زمینه را پیش از انجام پروژهی کالن کسب کنید.
چه چیز ی را به چه اشخاصی پیشنهاد دهیم یا چگونه تبلیغات را کمتر و در همان حال موثرتر کنیم؟ این سوال اصلی
مدیران تبلیغاتی و مالکان کسب و کار است.
بهتر ین پیشنهاد ،موثرتر ین تبلیغات ،یافتن نیازمندی قطعی و یا احتمالی مشتر ی بر اساس رفتار مشتر ی ،گروهبندی
مشتر یان بر اساس نیاز آنها ،سالیق مشتر یان و مواردی از ین دست تماما از اهداف بهینه سازان تمامی کسب و
کارهاست .چنانچه بتوان موارد مذکور را تا حد معقولی شناسایی کرد ،میتوان موتورهای پیشنهاد دهندهای تولید
کرد تا با در نظرگرفتن این دادهها و الگور یتمهای مناسب بهتر ین پیشنهاد را به مشتر ی ارائه کند.
به مجموعه اقدامات فوق که درحال حاضر بازار گرمی دارد ،سیستمهای پیشنهاد دهنده گفته میشود .اجرای این
سیستم به دو شکل فیلتر ینگ با همکار ی و فیلتر ینگ براساس محتوا انجام میشود .فیلتر ینگ بر اساس همکار ی
مبتنی بر شباهت سلیقه و شباهت رفتار مشتر یان به یکدیگر است و فیلتر ینگ براساس محتوا مبتنی بر پیشینه و
سالیق خود مشتر ی است.
شاخه رسانه:
دو مبحث اصلی در گسترش هر کسب و کار ی اهمیت ز یادی دارد؛ جذب مشتر ی و نگهدار ی آن .موضوعاتی که هردو
هز ینهبر هستند .در کنار این مباحث ،متخصصین گسترش و بهبود کسب و کار به دنبال یافتن چگونگی اجرای این
دو هستند و در مرحله بعد به دنبال بهینه کردن آنها.
بر اساس تجر یبات و مدیر یت دانش صورت گرفته توسط دانشمندان علوم داده ،اولین شاخهی دستهبندی مشتر ی
" "Customer Segmentationتشخیص جدید و یا قدیمی بودن مشتر ی است؛ در صورت جدید بودن مشتر ی ما
زمان محدودی برای جذب بازدید کنندهی جدید وب سایت ،کانال و یا محصول دار یم .بنابراین باید براساس همان
اطالعات محدود اولیه¬ی مشتر ی ،چه به صورت خود اظهار ی و چه به صورت اطالعات در یافتی غیر مستقیم تصمیم
بگیر یم .میتوانیم با در نظر گرفتن موقعیت جغرافیایی ،بهتر ین مجموعه از تبلیغات و محتوا را به مشتر ی نشان دهیم
و ایشان را در فکر به محصول و اتمسفر مدنظر خودمان نگه دار یم .در مورد نگهدار ی مشتر ی مسئله کمی قابل
تخمینتر است ،چرا که ما رفتار مشتر یان خود را در طول حضورشان در فضای کسب و کارمان میتوانیم رصد کنیم.
در هر صورت با داشتن اطالعات رفتار مشتر ی ،پیشبینی آنکه چه خدماتی در آینده نزدیک و دور باب میل مشتری
است ،کار سختی نیست و با این عمل ،احتمال وابسته شدن مشتر ی و حضور ایشان در کسب و کار مدنظر به صورت
چشمگیر ی ارتقا خواهد یافت.
پیشبینی رفتار و سلیقهی مشتر ی ،درک نظر واقعی مشتر ی با نوع حیاتی که مشتر ی در سیستمهای مختلف دارد
میتواند ،ما را در یافتن " مسیر زندگی مشتر ی" یار ی کند .هر مشتر ی در سیستم ما مسیر زندگی مختص خودش را
دارد و ما انواع ز یادی از مشتر ی دار یم که هر کدام مسیر زندگی متفاوتی در سیستممان دارند .ما میتوانیم کشف
کنیم که کدام مشتر ی ،چقدر از مسیر زندگی پیشبینی شده فاصله گرفته و خارج از عرف عمل میکند ،یا میتوانیم
بفهمیم کدام مشتر ی نزدیک به پایان مسیر زندگی در سیستم است و چرا .در این مرحله با استفاده از ابزار و اطالعات
الزم از ترک سیستم توسط ایشان و از دست رفتن آنها جلوگیر ی میکنیم.
تبلیغات بخش موثر و پر هز ینهی گسترش کسب و کارها است .احتماال مشاهده کردهاید که در فرمهای مختلف
سازمان ها و موسسات از شما میپرسند " از چه طر یق با ما آشنا شدید؟" .یکی از کارکردهای این سوال تحلیل این
مسئله است که کدام یک از روشهای تبلیغاتی موثرتر از باقی آنها عمل کرده و با استفاده از این دانش ،هز ینهی
تبلیغات با هدفمند شدنشان کاهش یابد.
حال چگونه میتوان مخاطب را شناسایی کرد و تبلیغات هدفمندی را به ایشان ارائه داد؟ بخش ز یادی از پروژههای
دستهبندی مشتر ی ،تحلیل احساس مشتر ی ،سیستمهای پیشنهاد دهنده ،نگهدار ی مشتر ی و غیره دارای تحلیلها و
فرایندهای مشترک هستند .بنابراین اکثر آنچه در این پروژهها انجام میشود ،در پروژههای دیگر نیز کاربرد دارد.
جهت هدفمند شدن تبلیغات محتمل است که ما تصمیم به انجام "تحلیل احساس مشتر ی" بگیر یم و خروجی این
مرحله را در ز یر سیستم نگهدار ی مشتر ی ،پیش بینی رفتار آینده مشتر ی ،سیستمهای پیشنهاد دهنده و تولید محتوای
آینده استفاده کنیم .اما استفادهی نهایی ما تعیین کنندهی مسیر انجام پروژه و کنترل کیفیت ماژولهای خاص پروژه
ما است.
به این سواالت دقت کنید .چه میخوانند؟ چه چیز ی را دوست دارند و چه چیز ی را دوست ندارند؟ چه نظر ی دارند؟
به دنبال چه هستند؟ کدام مطلب بر سر راهشان ز یاد و اضافه است؟ و تاثیر کدام تا چه اندازه بهتر است؟
امروزه پیشبینی رفتار مخاطبان با تحلیل فضای مجاز ی و رفتار مشتر ی در شبکهی کسب و کار شخصی قابل تشخیص
است .با مشخص شدن پاسخ این سواالت ما میدانیم جامعهی هدفمان کیست ،چقدر است ،موثرتر ین عامل بر روی
آنها چیست و ...با دانستن این موارد با کمتر ین هز ینه ،موثرتر ین موارد را تولید و یا به آنها پیشنهاد میدهیم و
میدانیم از چه چیز ی اجتناب کنیم.
در باب مهارت فنی الزم باید گفت که تکنینک کافی ودانش الزم درپردازش متن جزء ضرور یات ماست که ارزش آن
نیاز به یاداور ی ندارد .درحال حاضر الیکها ،کامنتها ،تار یخچهی کلیک بر روی آیکونهای سایت ،عالقهمندی
دوستان مجاز ی و چند مورد دیگر از مواردی است که برای پیشبینی و تحلیل رفتار مشتر یان قابل دسترسی است.
در برخی کسب و کارها ،به دلیل سرعت باالی تغییرات ،دادهها به صورت لحظهای به سیستم اضافه میشوند؛ مانند
قیمت طال و دالر در بازار بورس جهانی .در این موارد نیاز به سیستمهای هوشمندی است که دادهها را به صورت
Real Timeپردازش و نتایج را بر روی تصمیمگیر یها اعمال کند .هر تغییر و یا Content Driftدر این سیستم وارد
الگور یتم شده و به طور خودکار نتایج را بهروز میکند و اگر سیستم دارای قابلیت تصمیمگیر ی خودکار باشد ،براساس
نتایج تصمیمات جدیدی را اتخاذ میکند.
معمار ی و طراحی این سیستمها نیاز به تکنیک و پیچیدگی بیشتر دارد و چالشهای متفاوتی نسبت سیستمهای
Batchیا پردازش دست جمعی دارد.
شاخه های بسیار ی را میتوان در کاربرد علم داده نام برد .از جمله:
✓ نظامی :بهینه کردن محل برخورد موشک ،تشخیص حمالت سایبر ی و غیره
✓ تولید محتوا
✓ بررسی وقایع اجتماعی
✓ راهانداز ی کمپین انتخاباتی و تبلیغاتی
✓ قانونگذار ی خرد و کالن
✓ پیشبینی تاثیر قوانین وضع شده در حوزهی مالی ،اجتماعی و غیره
اما در آخر باید در نظر داشت که تمامی توانمدی دانشمند علم داده بر اساس دادهها موجود است .متاسفانه یکی از
آفات بزرگ فعلی برای اجرای پروژه های موفق علم دادهای ،عدم ثبت وقایع و موضوعات ارزشمند است .این موارد
باید توسط دانشمندان علوم داده در اسرع وقت شناسایی شده و به کارفرما یا تیم تولید کننده نرم افزار گزارش شود.
اما این نکته نباید ذات کنجکاوانه و تحلیلی ما را تحت تاثیر قرار دهد .چرا که در بسیار ی از مواقع دادههایی که مورد
نیاز هستند اما ثبت نشدهاند و یا به هر دلیل در دسترس نیستند ،از طر یق دادههای موجود دیگر قابل احصا هستند.