اکثر پروژه های علوم داده، به ویژه آنهایی که از مقیاس کافی و پیچیدگی کافی برخورداراند توسط تیم هایی اداره می شوند که مهارت های مختلفی در دل خود دارند. سازمان های مختلف نام های مختلفی به این مهارت ها و نقش ها اعطا می کنند.
با این حال، در اکثر موارد، این نقش ها به سه دسته تقسیم می شود که با مراحل یک کار تحلیلی مطابق دارد.
مهندسان داده در درجه اول مسئول جمع آوری، تبدیل و سازماندهی اطلاعاتی برای یک پروژه تحلیلی هستند.
مهندسان داده نیاز به مهارت در حوزه های علوم کامپیوتر و مهندسی نرم افزار دارند و باید در مورد برنامه ریزی، مدل سازی داده ها و پایگاه داده مهارت هایی کسب کرده باشند.
دانشمندان داده، همچنین به عنوان متخصصان آمار هم شناخته می شود و مسئول توسعه و اجرای مدل های تحلیلی هستند
دانشمندان داده، داده ها را پردازش می کنند تا بینش های مورد نیاز برای اهداف کسب وکار را بدست آورند.
چنین افرادی در تجزیه و تحلیل آماری، و به طور فزاینده ای، در طیف جدیدتر از تکنیک های تجزیه و تحلیل های قدرتمند، مانند یادگیری ماشین، پردازش زبان طبیعی و تجزیه و تحلیل شبکه های اجتماعی نیاز به مهارت دارند.
مترجمان داده رابط بین تیم تجزیه و تحلیل و بقیه کسب و کار هستند.
آنها به خوبی کسب و کار را درک می کنند و درک وسیعی (ونه لزوما عمیق) از مراحل فنی فرایند تجزیه و تحلیل داده ها دارند.
مترجمان داده مسئول تعریف سوالاتی در حوزه کسب و کار هستند که انگیزه لازم برای پروژه تجزیه و تحلیل را فراهم می کند، یک مترجم داده کمک می کند که نیازهای یک کسب وکار به درستی به مهندسان داده و دانشمندان داده منتقل شود، و در نهایت یک استراتژی برای به دست آوردن اطلاعات مناسب فراهم می کند و داده های خروجی تیم تجزیه و تحلیل را برای مدیران و ذینفعان کسب وکار ترجمه می کنند تا نگرش های مناسبی در تصمیم گیری های کلان به دست آورند.
علاوه بر این سه نقش نباید فراموش کنیم که تیم ها وقتی بهتر عمل می کنند که یک رهبر خوب داشته باشند.
یک مدیر یا رهبر خوب تمام پروسه را نظارت می کند و روابط میان اعضای تیم و همچنین ذینفعان کسب و کار را مدیریت می کند.
نقش دیگری که معمولا در زمینه تحلیل داده ها اهمیت دارد تحلیلگر داده است.
تحلیلگران داده ها معمولا کارمندانی با رتبه های پایینتر هستند که به افراد دیگر در یک سازمان کمک می کنند تا پاسخ سوالات خود را ساده تر پیدا کنند.
تحلیل گران داده به سوالات ساده تری جواب می دهند و این سوالات را با ایجاد پایگاه داده ها و انبارهای داده، و استفاده از نرم افزارهای مصورسازی اطلاعات برای ساختن نمودار ها و گزارش ها پاسخ می دهند.
وضعیت شغلی برای این موقعیت های شغلی چطور است؟
همه این نقش ها در حال حاضر تقاضای بالایی دارند و همه آنها بسیار هیجان انگیز و سودآور هستند ولی این شغل ها پیش نیازهای مهارتی مختلفی را طلب می کنند.
مهندسین داده معمولا دارای درجه علمی کامپیوتر هستند که در علوم داده هم تخصص دارند.
دانشمندان داده اغلب دارای پس زمینه ریاضی و آمار هستند اما معمولا پس زمینه ای از علم کامپیوتر را دارا هستند، چراکه بسیاری از مباحث جدید در حوزه داده های بزرگ مبنای الگوریتمی دارند.
مترجمان داده اغلب داری دانش در زمینه علوم مدیریتی هستند.
در این نمودار، توزیع مهارت هایی را که هر یک از این نقش ها باید داشته باشند را می بینیم
دنبال یه سرمایه گذار برای راه اندازی کار