Data Analyst Farsi
Data Analyst Farsi
بحث و تفسیر درباره تجزیه و تحلیل دادهها پایان ندارد ،ز یرا که گر یزی از این موضو ع
نیست“ .تجزیه و تحلیل دادهها یکی از جذاب ترین مشاغل قرن ۲۱است” .یافتن توصیف
به صورت روزمره انجام ) (Data Analystبدون هیچ زحمتی از آنچه یک تحلیلگر داده
میدهد ،همیشه آسان نیست .این مسئله با این واقعیت که تجزیه و تحلیل دادهها اغلب
با زمینه های مرتبط مانند علوم داده ،یادگیری ماشین ،هوش مصنوعی و تجزیه و تحلیل
از آنجایی که تجزیه و تحلیل دادهها نقشی اساسی در همه این زمینهها بازی میکند ،همواره
دقیقا چیست و تحلیلگر داده این سوال در ذهن مرور خواهد شد که تجزیه و تحلیل داده
.در واقع چه کاری انجام می دهد؟ در این متن سعی داریم به این دو سوال مهم پاسخ دهیم
تجزیه و تحلیل داده چیست؟
قبل از بررسی کاری که یک تحلیلگر داده انجام میدهد ،لازم است به این سوال پاسخ دهیم
که :تجزیه و تحلیل داده چیست و چرا اهمیت دارد؟ در سادهترین شکل ،تجزیه و تحلیل
دادهها فرایند استخراج معنا از اطلاعات بینظم است .با کاوش سیستماتیک دادهها برای
الگوها و روابط خاص ،تحلیلگران داده به دنبال یافتن و استخراج بینش مفید با استفاده از
تقریبا هر چیزی که تصور کنید را میتوان “داده” به حساب آورد .غالبا ،دادهها عددی هستند
(داده های کمی) .اما اصوات ،تصاو یر ،کلمات یا هر چیز دیگری که به نوعی قابل تفسیر
کار یک تحلیلگر با آنچه به عنوان “داده خام” شناخته میشود ،آغاز خواهد شد .دادههای
خام بینظم بوده و اساسا بی معنی هستند .ما فقط وقتی میتوانیم اطلاعات مفیدی از
آن ها بگیریم که به هر ج و مرج نظم بدهیم .بدین ترتیب ،جمعآوری ،تمیز کردن و سازماندهی
علاوه بر این ،تجزیه و تحلیل داده های موثر شامل بسیاری از تکنیک ها برای کمک به این
روند است .این موارد شامل آمار ،برنامهنویسی ،تجسم و موارد دیگر میشود .خوشبختانه،
برای ساده سازی این فرآیند ،بسیاری از این تکنیکها خودکار شدهاند .برخی حتی در نو ع
خود در حال توسعه هستند .با این حال ،یک تحلیلگر داده خوب باید در مورد همه آنها از
.ترکیب کنید و ببینید که چگونه تجزیه و تحلیل دادهها به ابزاری قدرتمند تبدیل میشود
تصمیم گیری مبتنی بر اطلاعات تجربی (به جای تکیه بر توهمات) راهی علمیتر برای حل
مشکلات است .گرچه این بدان معنا نیست که تجزیه و تحلیل دادهها همیشه ۱۰۰٪دقیق
عمل میکنند ،اما با این وجود بهترین ابزاری هستند که ما برای پیشبینی روندهای آینده و
تجزیه و تحلیل دادهها همچنین دارای طیف گستردهای از برنامهها در سراسر جوامع هستند.
بصورت آنلاین ،معمولا تجزیه و تحلیل دادههایی را پیدا میکنید که به عنوان ابزاری برای
هوش تجاری مورد تبلیغ قرار میگیرند ،به عنوان مثال پیشبینی فروش در آینده یا اطلاع
با این حال ،تجزیه و تحلیل داده ها بسیار فراتر از بهبود نتیجه فعالیت یک شرکت ،مورد توجه
است .این مسئله همچنین در صنایع بهداشتی برای بهبود مراقبت از بیمار استفاده
می شود .در حال حاضر برای تغییر نحوه تغذیه دنیا ،در کشاورزی از آن استفاده میکنند.
حتی توسط دولت ها برای مقابله با مسائلی مانند قاچاق انسان نیز استفاده میشود.
بنابراین اگر میخواهید به بهبود جهان – و همچنین کسب و کار خود -کمک کنید ،استخدام
.یک فرد حرفهای در تجزیه و تحلیل دادهها میتواند برای شما مناسب باشد
به بینش معناداری تبدیل کنید .به دنبال فرآیند تجزیه و تحلیل دادهها ،بر اساس دادهها و
اطلاعاتی که ارائه میشود ،مشکلات خاصی را حل می کنید یا به سوالات خاصی پاسخ
.میدهید
سپس این بینشها را به دست خواهید آورد و آنها را با ذینفعان و تصمیمگیرندگان اصلی
به اشتراک خواهید گذاشت ،که میتوانند بر اساس آن اقدام کنند یا برای آینده برنامهر یزی
نمایند .در عین حال ،تحلیلگران داده ممکن است مسئولیت نظارت بر روند کلی جمعآوری
و ذخیرهسازی داده ها و همچنین تنظیم دستورالعملهایی برای بهبود کیفیت دادهها را
.داشته باشند
به بخش مهمی از تقریباً هر صنعتی تبدیل شده است .تحلیلگران داده را در بخشهای
عدالت کیفری ،مد ،غذا ،فناوری ،کسبوکار ،محیط زیست و بخشهای عمومی از جمله
افرادی که تجزیه و تحلیل دادهها را انجام می دهند ممکن است عناوین دیگری مانند موارد
یک روش عالی برای سنجش آنچه که یک تحلیلگر داده به صورت روزانه انجام میدهد،
بررسی وظایف و مسئولیت هایی است که به طور معمول در شر ح وظایف تحلیلگر داده
.و سیستمهای جمعآوری داده را توسعه داده و پیادهسازی میکند پایگاههای داده
اصلی و اولویتبندی ) (KPIبرای شناسایی معیارهای مهم ،شاخصهای کلیدی عملکرد
.نیازهای یک کسب وکار را تعیین میکند
.جمع آوری داده ها از منابع داده اولیه (و یا ثانویه) را در اختیار دارد
.دادهها را فیلتر و تمیز میکند
.روندها و الگوها را در مجموعه داده های پیچیده شناسایی ،تحلیل و تفسیر مینماید
.یافتهها را تجسم کرده و به ذینفعان اصلی ارائه میدهد
.گزارشها را نوشته و شخصیسازی میکند
.داشبورد را توسعه و نگهداری میکند
اسناد مربوط به مدلها ،اقدامات و ز یرساختهای داده را هنگام تهیه آنها ایجاد و
.نگهداری مینماید
با ارزش ترین مهارتها برای تحلیلگران داده
.تحلیلگران داده دارای ترکیبی از مهارتهای فنی و مهارتهای رهبری هستند
یا پایتون است ،R .زبان SQLمهارتهای فنی شامل دانش زبانهای پایگاه داده مانند
یا Microsoft Excelتحلیلگر داده همچنین باید بتواند با ابزارهای صفحه گسترده مانند
کار کند .مهارتهای Qlikیا Tableauو نرمافزارهای تجسم دادهها مانند Google Sheets
ریاضی و آماری نیز برای کمک به جمعآوری ،اندازهگیری ،سازماندهی و تجزیه و تحلیل
میکند .این تواناییها به تحلیلگران اجازه می دهند تا به طور استراتژیک در مورد اطلاعاتی
که به ذینفعان در تصمیمگیریهای مبتنی بر دادهها کمک میکنند فکر کرده و ارزش این
اطلاعات را به طور موثر منتقل کنند .به عنوان مثال ،مدیران پروژه برای ردیابی مهمترین
معیارها برای پروژههای خود ،جهت تشخیص مشکلاتی که ممکن است رخ دهند و پیشبینی
اینکه چگونه عوامل مختلف می توانند به یک مشکل رسیدگی کنند ،به تحلیلگران دادهها
.متکی هستند
برای شناسایی و حل یک مشکل است .با پیشرفت شغلی خود ،میتوانید در یک زمینه
تخصص پیدا کنید .اگرچه به عنوان یک مبتدی ،خاص مانند تجسم داده یا مهندسی داده
دنبال کند ،چیست؟ اگرچه دنبال کردن یک کار به طور مستقیم پس از دیگری کمی سخت
است (ممکن است متوجه شوید که مراحل را تکرار میکنید یا به نقطه اول باز میگردید و
قسمت فرآیند است .به این دلیل که اگرچه به نظر می رسد یک مسئله واضح باشد ،همیشه
به عنوان مثال فرض کنیم شما در شرکتی کار میکنید که میخواهد درآمد خود را افزایش
دهد .مدیر یت ارشد قرار است با راهاندازی مجموعهای از محصولات جدید این کار را انجام
دهد .در نتیجه ،شما وقت و منابع زیادی را صرف تجزیه و تحلیل اینکه چه محصولی ایجاد
با این حال ،با کمی پیش بینی بیشتر ،ممکن است متوجه شوید که هیچ مشکلی در
محصولات موجود این شرکت وجود ندارد اما شاید روند فروش ضعیف است ،در نتیجه
رضایت مشتری کم بوده و معاملات کمتری صورت میگیرند .با این بینش ،ممکن است
دریابید که سرمایه گذاری در آموزش فروش ،باعث افزایش درآمد با هزینه بسیار کمتری
.میشود
اما اهمیت کاوش یک مسئله را از چند زاویه قبل از سرمایه گذاری زمان زیاد در آن نشان
می دهد .این مسئله همچنین به معنای نترسیدن از گفتن حقیقت با قدرت است (در این
مثال ،باید به مدیران بگویید که ایده محصول جدید آن ها اشتباه است) .تعریف سوالی که
میخواهید به آن پا سخ دهید شامل درک عمیق نیازها و خواستههای کسب و کار ،پیگیری
و … است .در این مرحله معمولا برخی از تجزیه و تحلیلهای اولیه را انجام KPIمعیارها،
.خواهید داد
شما در حل آن مسئله خاص ،مناسب هستند .این دادهها میتوانند شامل دادههای کمی
(مانند ارقام بازاریابی) یا دادههای کیفی (مانند بررسی مشتری) باشند .به طور خاص ،انواع
)دادههای شخص اول (مستقیما توسط شما یا سازمان جمعآوری میشود
)دادههای شخص دوم (دادههای شخص اول سازمان دیگری
).داده های شخص سوم (که از منابع متعدد توسط شخص ثالث جمعآوری میشوند
اگر از قبل به این داده ها دسترسی ندارید ،باید برای جمعآوری آنها استراتژی مناسبی را
تدوین کنید .این مسئله ممکن است شامل انجام نظرسنجیها ،نظارت بر شبکههای
اجتماعی ،تجزیه و تحلیل وب سایت ،ردیابی آنلاین و غیره باشد .با این وجود آنها را
جمعآوری میکنید و به محض اینکه دادهها در اختیار شما قرار میگیرند ،آماده تمیزسازی
.آنها هستید
هنوز سازماندهی نشده اند .پس از نظر میزان خطا نیز مورد بررسی قرار نگرفتهاند .برای
بدست آوردن وضعیتی که برای تجزیه و تحلیل مناسب است ،دادهها باید تمیز شوند .این
مسئله شامل ابزارها و تکنیک های مختلفی (مانند الگوریتمهای سفارشی ،نرمافزارهای
(به عنوان مثال مواردی که برای تجزیه و تحلیل شما مفید نیستند) ،ساختاردهی دادهها به
وقتی این کار تمام شد ،داده ها را تأیید خواهید کرد .این مهم شامل بررسی این نکته است
که آیا نیازهای شما برآورده شده اند یا خیر .اغلب ،متوجه خواهید شد که اینگونه نیست ،این
بدان معناست که شما باید یک قدم به عقب برگردید .به همین دلیل ،تمیزسازی دادهها یک
کنید .بسیاری از انواع تجزیه و تحلیل دادهها وجود دارد و بخشی از چالش این است که
مشخص کنید کدام روش برای کار در حال حاضر مناسبتر میباشد .برای ساده نگه داشتن
.موارد ،ما یک مرور کلی از چهار دسته اصلی تجزیه و تحلیل دادهها را ارائه خواهیم داد
اولین مورد تحلیل توصیفی است .این مهم شامل جمعبندی (یا توصیف) و یژگیهای یک
مجموعه داده برای درک بهتر آن میباشد .معمولا برای نتیجهگیری قاطع استفاده
.نمیشود ،اما اولین قدم مفید برای تصمیمگیری در مورد نحوه بررسی بیشتر دادهها است
در مرحله بعد ،تجزیه و تحلیل تشخیصی بر درک دلیل وقوع چیزی متمرکز است (به عنوان
مثال با کاوش در همبستگی بین مقادیر یک مجموعه داده) .این مسئله به شناسایی
مشکلات کمک می کند و اغلب در اولین مرحله تجزیه و تحلیل دادهها ،یعنی تعریف سوال،
.استفاده میشود
تجزیه و تحلیل پیشبینی و تجویزی
سرانجام ،ما تجزیه و تحلیل پیش بینی (که به شناسایی روندها بر اساس دادههای گذشته
کمک میکند) و تجزیه و تحلیل تجو یزی (که به تصمیمگیری در مورد یک اقدام آینده کمک
انجام یادگیری ماشین میکند) را در اختیار داریم .مورد دوم گاهی با استفاده از تکنیکهای
.میشود
5. نتیجهگیری از نتایج
هنگامی که شما تجزیه و تحلیل انجام دادهاید و برخی از بینشها را ترسیم کردهاید ،مرحله
آخر این است که این موارد را ابتدا به کسانی که آنها را سفارش دادهاند ،اعلام کنید .این
مسئله معمولا شامل تجسم دادهها به نوعی قابل درک (مثلا در یک نمودار یا دیاگرام)
.است
همچنین ممکن است شامل ایجاد داشبورد ،اسناد ،گزارشها یا ارائههای تعاملی باشد.
نادیده گرفتن این مرحله آسان است ،اما انجام صحیح آن حائز اهمیت بسیاری میباشد .نه
تنها باید یافتههای خود را به درستی تفسیر کنید ،بلکه باید آنها را به روشی که برای پرسنل
کسانی که به عنوان تحلیلگر داده شرو ع میکنند ،در نهایت دانشمند داده میشوند.
دانشمندان داده نیز مانند تحلیلگران ،از آمار ،ریاضیات و علوم کامپیوتر برای تجزیه و تحلیل
دادهها استفاده می کنند .با این حال ،دانشمند داده ممکن است از تکنیکهای پیشرفته برای
.ساخت مدلها و ابزارهای دیگر جهت ارائه بینش در مورد روندهای آینده استفاده کند
نتیجه سخن
در نهایت ،مهارت های تحلیلگر داده بسته به نقش او در سازمان متفاوت است .به عنوان
مثال ،برخورداری از دانش کسب و کاری که در آن کار میکنید ،در بررسی نقش و نیازهای
شما ،بسیار مهم است .با این حال ،به عنوان یک قاعده ،این مهارتها مواردی هستند که