Nitro AI Judge

OJIA 11-12

High-school

Romania

Individual

RO: Etapa Judeteana pentru clasele a XI-a si a XII-a a Olimpiadei de Inteligenta Artificiala / EN: Regional phase of the Romanian National Olympiad in Artificial Intelligence, for high school students in the 11th and 12th grades

Problems Communication Leaderboard Rules

🚚 SmartCargo - Optimizarea livrărilor în România 🤾‍♂️ Consum Caloric

Task Editorial

🚚 SmartCargo - Optimizarea livrărilor în România

Compania de transport „SmartCargo România” are nevoie de soluții inteligente pentru a îmbunătăți estimările privind durata livrărilor. Tu ești noul specialist în data science al echipei, iar misiunea ta este să construiești modele precise care să prezică timpii de livrare între orașele din România.

🎯 Scopul tău principal

Trebuie să analizezi date istorice privind cursele dintre orașe și să înțelegi cum factori precum distanța, ora din zi, vremea, traficul sau experiența șoferului influențează durata efectivă a livrării.

Scopul tău este să construiești un model de Machine Learning capabil să prezică timpul estimat pentru curse noi.

📦 Datele de transport

Fiecare rând din fișierele train_data.csv și test_data.csv reprezintă o livrare între două orașe din România.

Fiecare livrare conține următoarele detalii:

Coloana	Descriere
`ID`	Identificator unic al cursei
`City A`	Orașul de plecare (ca text)
`City B`	Orașul de destinație (ca text)
`Distance`	Distanța reală între orașe (în kilometri)
`Time of Day`	Momentul zilei exprimat în minute de la miezul nopții când pleacă o cursa (0 - 1439)
`Weather`	Vremea în timpul cursei (`Clear`, `Rain`, `Snow`, `Fog`)
`Traffic`	Nivelul traficului pe o scară numerică (0.0 - 1000.0), maximul înseamnă cel mai aglomerat
`Road Quality`	Calitatea drumului pe o scară numerică (1 - 1000), maximul înseamnă cel mai calitativ
`Driver Experience`	Nivelul de experiență al șoferului (1 - 40 ani)
`deliver_time`	Doar în `train_data.csv`: timpul real de livrare în minute

🎯 Misiunea ta

Managerul operațional ți-a dat următoarele două sarcini esențiale pentru îmbunătățirea operațiunilor „SmartCargo”.

Setul de Date pentru Predicție (test_data.csv) conține eșantioane cu aceleași caracteristici ca setul de antrenament, dar fără coloana predicted_time.

Modelul vostru va genera predicții pentru aceste eșantioane.

Subtask-uri

Sarcina 1 (20p): Situația Bârlad: un client important din Bârlad a raportat întârzieri frecvente pe cursele în condiții de ceață. Managerul vrea să afle câte curse pleacă din Bârlad și pe vreme de ceață (Fog) în setul de date de predicție. Găsește și raportează numărul acestor curse.
Sarcina 2: Estimarea Timpilor pentru curse necunoscute: Managerul are o listă de noi curse pentru care nu știe timpii de deplasare. Trebuie să folosești datele istorice (din setul de antrenare) pentru a antrena modele de predicție și apoi să estimezi timpii de livrare pentru toate cursele din setul de date pentru predicție.

Format de ieșire

Un fișier csv output.csv care să includă următoarele 3 coloane:

subtaskID - reprezintă numărul subtaskului (1, 2)
datapointID - care se referă la coloana ID din test_data.csv
answer - răspunsul corespunzător datapointului pentru subtaskul respectiv

Notă: Pentru subtask-ul 1, la care se cere un singur răspuns pentru tot setul de date, afișați o singură linie a cărei datapointID să fie 1.

Trimiteți un singur csv care să conțină răspunsurile pentru toate subtask-urile pe care le-ați rezolvat. Pentru a vedea un exemplu, descărcați fișierul sample_output.csv (Nota: acesta, desi in formatul corect, obtine 0 puncte la submisie).

Scor

Scorurile pentru subtask-uri se vor calcula după cum urmează:

Subtask 1: răspuns întreg, primiți 20 de puncte doar dacă este corect.
Subtask 2: în funcție de performanța modelului vostru, folosind metrica MAE (Mean Absolute Error) pe setul de date de testare. Puteți găsi modul exact de calcul al scorului bazat pe MAE în Starter Kit.

Files

Train Data Test Data Sample Output Starter Kit

Submission

My submissions

Only submissions marked as final are counted for the complete leaderboard. Not choosing any final submissions will result in 0 points on this task.

Showing partial scores

Complete submission scores will be displayed after the competition ends

🚚 SmartCargo - Optimizarea livrărilor în România

🎯 Scopul tău principal

Scopul tău este să construiești un model de Machine Learning capabil să prezică timpul estimat pentru curse noi.

📦 Datele de transport

Fiecare rând din fișierele train_data.csv și test_data.csv reprezintă o livrare între două orașe din România.

Fiecare livrare conține următoarele detalii:

Coloana	Descriere
`ID`	Identificator unic al cursei
`City A`	Orașul de plecare (ca text)
`City B`	Orașul de destinație (ca text)
`Distance`	Distanța reală între orașe (în kilometri)
`Time of Day`	Momentul zilei exprimat în minute de la miezul nopții când pleacă o cursa (0 - 1439)
`Weather`	Vremea în timpul cursei (`Clear`, `Rain`, `Snow`, `Fog`)
`Traffic`	Nivelul traficului pe o scară numerică (0.0 - 1000.0), maximul înseamnă cel mai aglomerat
`Road Quality`	Calitatea drumului pe o scară numerică (1 - 1000), maximul înseamnă cel mai calitativ
`Driver Experience`	Nivelul de experiență al șoferului (1 - 40 ani)
`deliver_time`	Doar în `train_data.csv`: timpul real de livrare în minute

🎯 Misiunea ta

Managerul operațional ți-a dat următoarele două sarcini esențiale pentru îmbunătățirea operațiunilor „SmartCargo”.

Setul de Date pentru Predicție (test_data.csv) conține eșantioane cu aceleași caracteristici ca setul de antrenament, dar fără coloana predicted_time.

Modelul vostru va genera predicții pentru aceste eșantioane.

Subtask-uri

Sarcina 1 (20p): Situația Bârlad: un client important din Bârlad a raportat întârzieri frecvente pe cursele în condiții de ceață. Managerul vrea să afle câte curse pleacă din Bârlad și pe vreme de ceață (Fog) în setul de date de predicție. Găsește și raportează numărul acestor curse.
Sarcina 2: Estimarea Timpilor pentru curse necunoscute: Managerul are o listă de noi curse pentru care nu știe timpii de deplasare. Trebuie să folosești datele istorice (din setul de antrenare) pentru a antrena modele de predicție și apoi să estimezi timpii de livrare pentru toate cursele din setul de date pentru predicție.

Format de ieșire

Un fișier csv output.csv care să includă următoarele 3 coloane:

subtaskID - reprezintă numărul subtaskului (1, 2)
datapointID - care se referă la coloana ID din test_data.csv
answer - răspunsul corespunzător datapointului pentru subtaskul respectiv

Notă: Pentru subtask-ul 1, la care se cere un singur răspuns pentru tot setul de date, afișați o singură linie a cărei datapointID să fie 1.

Scor

Scorurile pentru subtask-uri se vor calcula după cum urmează:

Subtask 1: răspuns întreg, primiți 20 de puncte doar dacă este corect.
Subtask 2: în funcție de performanța modelului vostru, folosind metrica MAE (Mean Absolute Error) pe setul de date de testare. Puteți găsi modul exact de calcul al scorului bazat pe MAE în Starter Kit.

Files

Train Data Test Data Sample Output Starter Kit

Submission

My submissions

Only submissions marked as final are counted for the complete leaderboard. Not choosing any final submissions will result in 0 points on this task.

Showing partial scores

Complete submission scores will be displayed after the competition ends

Task Editorial

🚚 SmartCargo - Optimizarea livrărilor în România

🎯 Scopul tău principal

Scopul tău este să construiești un model de Machine Learning capabil să prezică timpul estimat pentru curse noi.

📦 Datele de transport

Fiecare rând din fișierele train_data.csv și test_data.csv reprezintă o livrare între două orașe din România.

Fiecare livrare conține următoarele detalii:

Coloana	Descriere
`ID`	Identificator unic al cursei
`City A`	Orașul de plecare (ca text)
`City B`	Orașul de destinație (ca text)
`Distance`	Distanța reală între orașe (în kilometri)
`Time of Day`	Momentul zilei exprimat în minute de la miezul nopții când pleacă o cursa (0 - 1439)
`Weather`	Vremea în timpul cursei (`Clear`, `Rain`, `Snow`, `Fog`)
`Traffic`	Nivelul traficului pe o scară numerică (0.0 - 1000.0), maximul înseamnă cel mai aglomerat
`Road Quality`	Calitatea drumului pe o scară numerică (1 - 1000), maximul înseamnă cel mai calitativ
`Driver Experience`	Nivelul de experiență al șoferului (1 - 40 ani)
`deliver_time`	Doar în `train_data.csv`: timpul real de livrare în minute

🎯 Misiunea ta

Managerul operațional ți-a dat următoarele două sarcini esențiale pentru îmbunătățirea operațiunilor „SmartCargo”.

Setul de Date pentru Predicție (test_data.csv) conține eșantioane cu aceleași caracteristici ca setul de antrenament, dar fără coloana predicted_time.

Modelul vostru va genera predicții pentru aceste eșantioane.

Subtask-uri

Sarcina 1 (20p): Situația Bârlad: un client important din Bârlad a raportat întârzieri frecvente pe cursele în condiții de ceață. Managerul vrea să afle câte curse pleacă din Bârlad și pe vreme de ceață (Fog) în setul de date de predicție. Găsește și raportează numărul acestor curse.
Sarcina 2: Estimarea Timpilor pentru curse necunoscute: Managerul are o listă de noi curse pentru care nu știe timpii de deplasare. Trebuie să folosești datele istorice (din setul de antrenare) pentru a antrena modele de predicție și apoi să estimezi timpii de livrare pentru toate cursele din setul de date pentru predicție.

Format de ieșire

Un fișier csv output.csv care să includă următoarele 3 coloane:

subtaskID - reprezintă numărul subtaskului (1, 2)
datapointID - care se referă la coloana ID din test_data.csv
answer - răspunsul corespunzător datapointului pentru subtaskul respectiv

Notă: Pentru subtask-ul 1, la care se cere un singur răspuns pentru tot setul de date, afișați o singură linie a cărei datapointID să fie 1.

Scor

Scorurile pentru subtask-uri se vor calcula după cum urmează:

Subtask 1: răspuns întreg, primiți 20 de puncte doar dacă este corect.
Subtask 2: în funcție de performanța modelului vostru, folosind metrica MAE (Mean Absolute Error) pe setul de date de testare. Puteți găsi modul exact de calcul al scorului bazat pe MAE în Starter Kit.

Files

Train Data Test Data Sample Output Starter Kit

Submission

My submissions

Only submissions marked as final are counted for the complete leaderboard. Not choosing any final submissions will result in 0 points on this task.

Showing partial scores

Complete submission scores will be displayed after the competition ends

🚚 SmartCargo - Optimizarea livrărilor în România

🎯 Scopul tău principal

Scopul tău este să construiești un model de Machine Learning capabil să prezică timpul estimat pentru curse noi.

📦 Datele de transport

Fiecare rând din fișierele train_data.csv și test_data.csv reprezintă o livrare între două orașe din România.

Fiecare livrare conține următoarele detalii:

Coloana	Descriere
`ID`	Identificator unic al cursei
`City A`	Orașul de plecare (ca text)
`City B`	Orașul de destinație (ca text)
`Distance`	Distanța reală între orașe (în kilometri)
`Time of Day`	Momentul zilei exprimat în minute de la miezul nopții când pleacă o cursa (0 - 1439)
`Weather`	Vremea în timpul cursei (`Clear`, `Rain`, `Snow`, `Fog`)
`Traffic`	Nivelul traficului pe o scară numerică (0.0 - 1000.0), maximul înseamnă cel mai aglomerat
`Road Quality`	Calitatea drumului pe o scară numerică (1 - 1000), maximul înseamnă cel mai calitativ
`Driver Experience`	Nivelul de experiență al șoferului (1 - 40 ani)
`deliver_time`	Doar în `train_data.csv`: timpul real de livrare în minute

🎯 Misiunea ta

Managerul operațional ți-a dat următoarele două sarcini esențiale pentru îmbunătățirea operațiunilor „SmartCargo”.

Setul de Date pentru Predicție (test_data.csv) conține eșantioane cu aceleași caracteristici ca setul de antrenament, dar fără coloana predicted_time.

Modelul vostru va genera predicții pentru aceste eșantioane.

Subtask-uri

Sarcina 1 (20p): Situația Bârlad: un client important din Bârlad a raportat întârzieri frecvente pe cursele în condiții de ceață. Managerul vrea să afle câte curse pleacă din Bârlad și pe vreme de ceață (Fog) în setul de date de predicție. Găsește și raportează numărul acestor curse.
Sarcina 2: Estimarea Timpilor pentru curse necunoscute: Managerul are o listă de noi curse pentru care nu știe timpii de deplasare. Trebuie să folosești datele istorice (din setul de antrenare) pentru a antrena modele de predicție și apoi să estimezi timpii de livrare pentru toate cursele din setul de date pentru predicție.

Format de ieșire

Un fișier csv output.csv care să includă următoarele 3 coloane:

subtaskID - reprezintă numărul subtaskului (1, 2)
datapointID - care se referă la coloana ID din test_data.csv
answer - răspunsul corespunzător datapointului pentru subtaskul respectiv

Notă: Pentru subtask-ul 1, la care se cere un singur răspuns pentru tot setul de date, afișați o singură linie a cărei datapointID să fie 1.

Scor

Scorurile pentru subtask-uri se vor calcula după cum urmează:

Subtask 1: răspuns întreg, primiți 20 de puncte doar dacă este corect.
Subtask 2: în funcție de performanța modelului vostru, folosind metrica MAE (Mean Absolute Error) pe setul de date de testare. Puteți găsi modul exact de calcul al scorului bazat pe MAE în Starter Kit.

Files

Train Data Test Data Sample Output Starter Kit

Submission

My submissions

Only submissions marked as final are counted for the complete leaderboard. Not choosing any final submissions will result in 0 points on this task.

Showing partial scores

Complete submission scores will be displayed after the competition ends