بازار حمل بار بین شهری ایران، بازاری بسیار بزرگ است که در آن روزانه حدود ۸۰ هزار بارنامه صادر شده و به این ترتیب صاحبان بار، کالاهای خود را از طریق انواع خودروهای سنگین به سراسر کشور منتقل میکنند. در این بین، قیمت حمل بار یکی از اصلیترین عوامل در تصمیمگیری برای صاحبان بار و رانندگان است. با توجه به تنوع خودروهای سنگین حمل بار، مبدا و مقصدهای متفاوت و بسیاری عوامل دیگر، تعیین قیمت مناسب برای حمل هر بار با چالشهایی روبرو است.
اوبار، بزرگترین سامانه هوشمند حمل بار بین شهری ایران است. این سامانه، با برقرار کردن ارتباط بین صاحبان بار و رانندگان، اثربخشی این بازار مهم را افزایش داده است. روش کار اوبار به این صورت است که سفارشهای حمل بار مشتریان را از سراسر کشور گرفته و جهت حمل آنها، برای رانندگان خودروهای سنگین اعلام بار میکند. با وجود ۲۰ هزار صاحب بار و بیش از ۵۵ هزار راننده موجود در سامانه، تعیین قیمتی که از دیدگاه صاحبان بار و رانندگان مناسب باشد، تاثیر بسزایی در عملکرد این سامانه دارد. به همین دلیل سامانه اوبار با استفاده از الگوریتمهای یادگیری ماشین، سعی کرده است قیمتگذاری شفاف، سریع و مناسبی را ارائه کند.
اوبار با همکاری شرکت تحلیل داده سانا ابر داده، مسابقهای در این زمینه برگزار کرد. در این مسابقه شما را به چالش کشیدیم تا با استفاده از الگوریتمهای یادگیری ماشین و با داشتن اطلاعات برخی بارهای حمل شده، مدلی بسازید که بتواند قیمت حمل بار را پیشبینی کند. این مسابقه از تاریخ ۱ خرداد ۱۳۹۷ در سایت kaggle شروع شده و بنا بود تا تاریخ ۳۱ خرداد ادامه داشته باشد که با تمدیدی ۱۰ روزه، در تاریخ ۱۰ تیرماه ۱۳۹۷ به پایان رسید. با شرکت در این مسابقه میتوانستید دانش تحلیل داده خودتان را بر روی دادههای واقعی یک مساله مهم پیادهسازی کرده و تواناییهای تحلیل داده خود را با بقیه افراد مقایسه کنید. علاوه بر این، به ۳ نفری که در پایان مسابقه بهترین پیشبینیها را انجام داده باشند به ترتیب ۵۰ میلیون ریال، سکه بهار آزادی و سکه نیم بهار آزادی جایزه تعلق میگرفت.
مسابقه در سایت kaggle و با نام ubaar competition برگزار میشود. برای شرکت در این مسابقه، میتوانید به این آدرس مراجعه کرده و پس از وارد شدن به حساب کاربری kaggle خود، وارد مسابقه شوید.
توجه: با نظر به تحریم ایران، برای ورود به سایت kaggle باید ip خود را تغییر دهید.
در صفحه مسابقه، زیر قسمت data میتوانید دادههای مورد نیاز برای یادگیری و پیشبینی را دریافت کرده و توضیحات کلی درباره فیلدهای این فایل ها را مشاهده نمایید. در این قسمت، فایل train.csv شامل اطلاعات مربوط به حمل ۵۰,۰۰۰ بار بوده و میتوانید با استفاده از این دادهها، مدل پیشبینی قیمت خود را آماده سازید. فایل test.csv شامل اطلاعات مربوط به حمل ۱۵,۰۰۰ بار بوده و برای این دادهها باید قیمت را پیشبینی کنید. فایل sampleSubmission15kRandom.cs نمونهای از فرمت خروجی پیشبینیها است. معیار سنجش دقت پیشبینی در قسمت evaluation توضیح داده شده است. در نهایت، میتوانید خروجی مدلهای خود را (با فرمت مشخصشده) در صفحه مسابقه submit کرده و پس از چند لحظه، میزان خطای پیشبینی خود و رتبه لحظهای خود را در بخش leaderboard مشاهده کنید. امکان ثبت روزانه ۵ پیشبینی در صفحه مسابقه برای شما فراهم آمده است.
توجه کنید که طبق روال همیشگی مسابقات kaggle، برای جلوگیری از overfitting در دادههای تست، بخشی از دادههای تست برای سنجش در public leaderboard محاسبه شده و بخشی از دادههای تست برای سنجش نهایی و private leaderboard نگهداری میشود. یعنی لزوما خطای نمایشدادهشده در public leaderboard، برابر خطای کل پیشبینی شما نبوده و در پایان مسابقه، افرادی که بهترین نتیجه را از سنجش دادههای private leaderboard بدست آورند، برنده جوایز خواهند بود.
به لطف حضور شرکتکنندگان و متخصصین پردازش داده چالش بسیار هیجانانگیز و داغی را پشت سر گذاشتیم و در انتها تیمهای Infestissumam ،Yasser Tabandeh و UI به عنوان تیمهای اول تا سوم برگزیده شدند که به ایشان صمیمانه تبریک میگوییم. به پاس قدردانی از برندگان و پس از هماهنگی با ایشان در چند روز آینده مراسمی به این منظور در محل شرکت ساناگستر سبز برگزار خواهد شد که جوایز مسابقه در این مراسم اهدا خواهد گردید. گزارش مراسم نیز متعاقبا همینجا قرار خواهد گرفت.
اطلاعات تکمیلی در همین صفحه بهروز خواهند شد
در صورتی که تمایل به کار در زمینه تحلیل داده بر روی مسائل جذاب و کاربردی را داشته باشید، خوشحال میشویم رزومه خود را (با تیتر ubaar competition) به آدرس ارسال کنید تا با شما تماس بگیریم.