OJIA 11-12
RO: Etapa Judeteana pentru clasele a XI-a si a XII-a a Olimpiadei de Inteligenta Artificiala / EN: Regional phase of the Romanian National Olympiad in Artificial Intelligence, for high school students in the 11th and 12th grades
🚚 SmartCargo - Optimizarea livrărilor în România
Compania de transport „SmartCargo România” are nevoie de soluții inteligente pentru a îmbunătăți estimările privind durata livrărilor. Tu ești noul specialist în data science al echipei, iar misiunea ta este să construiești modele precise care să prezică timpii de livrare între orașele din România.
🎯 Scopul tău principal
Trebuie să analizezi date istorice privind cursele dintre orașe și să înțelegi cum factori precum distanța, ora din zi, vremea, traficul sau experiența șoferului influențează durata efectivă a livrării.
Scopul tău este să construiești un model de Machine Learning capabil să prezică timpul estimat pentru curse noi.
📦 Datele de transport
Fiecare rând din fișierele train_data.csv
și test_data.csv
reprezintă o livrare între două orașe din România.
Fiecare livrare conține următoarele detalii:
Coloana | Descriere |
---|---|
ID | Identificator unic al cursei |
City A | Orașul de plecare (ca text) |
City B | Orașul de destinație (ca text) |
Distance | Distanța reală între orașe (în kilometri) |
Time of Day | Momentul zilei exprimat în minute de la miezul nopții când pleacă o cursa (0 - 1439) |
Weather | Vremea în timpul cursei (Clear , Rain , Snow , Fog ) |
Traffic | Nivelul traficului pe o scară numerică (0.0 - 1000.0), maximul înseamnă cel mai aglomerat |
Road Quality | Calitatea drumului pe o scară numerică (1 - 1000), maximul înseamnă cel mai calitativ |
Driver Experience | Nivelul de experiență al șoferului (1 - 40 ani) |
deliver_time | Doar în train_data.csv : timpul real de livrare în minute |
🎯 Misiunea ta
Managerul operațional ți-a dat următoarele două sarcini esențiale pentru îmbunătățirea operațiunilor „SmartCargo”.
Setul de Date pentru Predicție (test_data.csv
) conține eșantioane cu aceleași caracteristici ca setul de antrenament, dar fără coloana predicted_time
.
Modelul vostru va genera predicții pentru aceste eșantioane.
Subtask-uri
- Sarcina 1 (20p): Situația Bârlad: un client important din Bârlad a raportat întârzieri frecvente pe cursele în condiții de ceață. Managerul vrea să afle câte curse pleacă din Bârlad și pe vreme de ceață (
Fog
) în setul de date de predicție. Găsește și raportează numărul acestor curse. - Sarcina 2: Estimarea Timpilor pentru curse necunoscute: Managerul are o listă de noi curse pentru care nu știe timpii de deplasare. Trebuie să folosești datele istorice (din setul de antrenare) pentru a antrena modele de predicție și apoi să estimezi timpii de livrare pentru toate cursele din setul de date pentru predicție.
Format de ieșire
Un fișier csv output.csv
care să includă următoarele 3 coloane:
subtaskID
- reprezintă numărul subtaskului (1, 2)datapointID
- care se referă la coloanaID
dintest_data.csv
answer
- răspunsul corespunzător datapointului pentru subtaskul respectiv
Notă: Pentru subtask-ul 1, la care se cere un singur răspuns pentru tot setul de date, afișați o singură linie a cărei datapointID
să fie 1.
Trimiteți un singur csv care să conțină răspunsurile pentru toate subtask-urile pe care le-ați rezolvat. Pentru a vedea un exemplu, descărcați fișierul sample_output.csv
(Nota: acesta, desi in formatul corect, obtine 0 puncte la submisie).
Scor
Scorurile pentru subtask-uri se vor calcula după cum urmează:
- Subtask 1: răspuns întreg, primiți 20 de puncte doar dacă este corect.
- Subtask 2: în funcție de performanța modelului vostru, folosind metrica MAE (Mean Absolute Error) pe setul de date de testare. Puteți găsi modul exact de calcul al scorului bazat pe MAE în Starter Kit.
Submission
My submissions
Only submissions marked as final are counted for the complete leaderboard. Not choosing any final submissions will result in 0 points on this task.
Complete submission scores will be displayed after the competition ends
🚚 SmartCargo - Optimizarea livrărilor în România
Compania de transport „SmartCargo România” are nevoie de soluții inteligente pentru a îmbunătăți estimările privind durata livrărilor. Tu ești noul specialist în data science al echipei, iar misiunea ta este să construiești modele precise care să prezică timpii de livrare între orașele din România.
🎯 Scopul tău principal
Trebuie să analizezi date istorice privind cursele dintre orașe și să înțelegi cum factori precum distanța, ora din zi, vremea, traficul sau experiența șoferului influențează durata efectivă a livrării.
Scopul tău este să construiești un model de Machine Learning capabil să prezică timpul estimat pentru curse noi.
📦 Datele de transport
Fiecare rând din fișierele train_data.csv
și test_data.csv
reprezintă o livrare între două orașe din România.
Fiecare livrare conține următoarele detalii:
Coloana | Descriere |
---|---|
ID | Identificator unic al cursei |
City A | Orașul de plecare (ca text) |
City B | Orașul de destinație (ca text) |
Distance | Distanța reală între orașe (în kilometri) |
Time of Day | Momentul zilei exprimat în minute de la miezul nopții când pleacă o cursa (0 - 1439) |
Weather | Vremea în timpul cursei (Clear , Rain , Snow , Fog ) |
Traffic | Nivelul traficului pe o scară numerică (0.0 - 1000.0), maximul înseamnă cel mai aglomerat |
Road Quality | Calitatea drumului pe o scară numerică (1 - 1000), maximul înseamnă cel mai calitativ |
Driver Experience | Nivelul de experiență al șoferului (1 - 40 ani) |
deliver_time | Doar în train_data.csv : timpul real de livrare în minute |
🎯 Misiunea ta
Managerul operațional ți-a dat următoarele două sarcini esențiale pentru îmbunătățirea operațiunilor „SmartCargo”.
Setul de Date pentru Predicție (test_data.csv
) conține eșantioane cu aceleași caracteristici ca setul de antrenament, dar fără coloana predicted_time
.
Modelul vostru va genera predicții pentru aceste eșantioane.
Subtask-uri
- Sarcina 1 (20p): Situația Bârlad: un client important din Bârlad a raportat întârzieri frecvente pe cursele în condiții de ceață. Managerul vrea să afle câte curse pleacă din Bârlad și pe vreme de ceață (
Fog
) în setul de date de predicție. Găsește și raportează numărul acestor curse. - Sarcina 2: Estimarea Timpilor pentru curse necunoscute: Managerul are o listă de noi curse pentru care nu știe timpii de deplasare. Trebuie să folosești datele istorice (din setul de antrenare) pentru a antrena modele de predicție și apoi să estimezi timpii de livrare pentru toate cursele din setul de date pentru predicție.
Format de ieșire
Un fișier csv output.csv
care să includă următoarele 3 coloane:
subtaskID
- reprezintă numărul subtaskului (1, 2)datapointID
- care se referă la coloanaID
dintest_data.csv
answer
- răspunsul corespunzător datapointului pentru subtaskul respectiv
Notă: Pentru subtask-ul 1, la care se cere un singur răspuns pentru tot setul de date, afișați o singură linie a cărei datapointID
să fie 1.
Trimiteți un singur csv care să conțină răspunsurile pentru toate subtask-urile pe care le-ați rezolvat. Pentru a vedea un exemplu, descărcați fișierul sample_output.csv
(Nota: acesta, desi in formatul corect, obtine 0 puncte la submisie).
Scor
Scorurile pentru subtask-uri se vor calcula după cum urmează:
- Subtask 1: răspuns întreg, primiți 20 de puncte doar dacă este corect.
- Subtask 2: în funcție de performanța modelului vostru, folosind metrica MAE (Mean Absolute Error) pe setul de date de testare. Puteți găsi modul exact de calcul al scorului bazat pe MAE în Starter Kit.
Submission
My submissions
Only submissions marked as final are counted for the complete leaderboard. Not choosing any final submissions will result in 0 points on this task.
Complete submission scores will be displayed after the competition ends
🚚 SmartCargo - Optimizarea livrărilor în România
Compania de transport „SmartCargo România” are nevoie de soluții inteligente pentru a îmbunătăți estimările privind durata livrărilor. Tu ești noul specialist în data science al echipei, iar misiunea ta este să construiești modele precise care să prezică timpii de livrare între orașele din România.
🎯 Scopul tău principal
Trebuie să analizezi date istorice privind cursele dintre orașe și să înțelegi cum factori precum distanța, ora din zi, vremea, traficul sau experiența șoferului influențează durata efectivă a livrării.
Scopul tău este să construiești un model de Machine Learning capabil să prezică timpul estimat pentru curse noi.
📦 Datele de transport
Fiecare rând din fișierele train_data.csv
și test_data.csv
reprezintă o livrare între două orașe din România.
Fiecare livrare conține următoarele detalii:
Coloana | Descriere |
---|---|
ID | Identificator unic al cursei |
City A | Orașul de plecare (ca text) |
City B | Orașul de destinație (ca text) |
Distance | Distanța reală între orașe (în kilometri) |
Time of Day | Momentul zilei exprimat în minute de la miezul nopții când pleacă o cursa (0 - 1439) |
Weather | Vremea în timpul cursei (Clear , Rain , Snow , Fog ) |
Traffic | Nivelul traficului pe o scară numerică (0.0 - 1000.0), maximul înseamnă cel mai aglomerat |
Road Quality | Calitatea drumului pe o scară numerică (1 - 1000), maximul înseamnă cel mai calitativ |
Driver Experience | Nivelul de experiență al șoferului (1 - 40 ani) |
deliver_time | Doar în train_data.csv : timpul real de livrare în minute |
🎯 Misiunea ta
Managerul operațional ți-a dat următoarele două sarcini esențiale pentru îmbunătățirea operațiunilor „SmartCargo”.
Setul de Date pentru Predicție (test_data.csv
) conține eșantioane cu aceleași caracteristici ca setul de antrenament, dar fără coloana predicted_time
.
Modelul vostru va genera predicții pentru aceste eșantioane.
Subtask-uri
- Sarcina 1 (20p): Situația Bârlad: un client important din Bârlad a raportat întârzieri frecvente pe cursele în condiții de ceață. Managerul vrea să afle câte curse pleacă din Bârlad și pe vreme de ceață (
Fog
) în setul de date de predicție. Găsește și raportează numărul acestor curse. - Sarcina 2: Estimarea Timpilor pentru curse necunoscute: Managerul are o listă de noi curse pentru care nu știe timpii de deplasare. Trebuie să folosești datele istorice (din setul de antrenare) pentru a antrena modele de predicție și apoi să estimezi timpii de livrare pentru toate cursele din setul de date pentru predicție.
Format de ieșire
Un fișier csv output.csv
care să includă următoarele 3 coloane:
subtaskID
- reprezintă numărul subtaskului (1, 2)datapointID
- care se referă la coloanaID
dintest_data.csv
answer
- răspunsul corespunzător datapointului pentru subtaskul respectiv
Notă: Pentru subtask-ul 1, la care se cere un singur răspuns pentru tot setul de date, afișați o singură linie a cărei datapointID
să fie 1.
Trimiteți un singur csv care să conțină răspunsurile pentru toate subtask-urile pe care le-ați rezolvat. Pentru a vedea un exemplu, descărcați fișierul sample_output.csv
(Nota: acesta, desi in formatul corect, obtine 0 puncte la submisie).
Scor
Scorurile pentru subtask-uri se vor calcula după cum urmează:
- Subtask 1: răspuns întreg, primiți 20 de puncte doar dacă este corect.
- Subtask 2: în funcție de performanța modelului vostru, folosind metrica MAE (Mean Absolute Error) pe setul de date de testare. Puteți găsi modul exact de calcul al scorului bazat pe MAE în Starter Kit.
Submission
My submissions
Only submissions marked as final are counted for the complete leaderboard. Not choosing any final submissions will result in 0 points on this task.
Complete submission scores will be displayed after the competition ends
🚚 SmartCargo - Optimizarea livrărilor în România
Compania de transport „SmartCargo România” are nevoie de soluții inteligente pentru a îmbunătăți estimările privind durata livrărilor. Tu ești noul specialist în data science al echipei, iar misiunea ta este să construiești modele precise care să prezică timpii de livrare între orașele din România.
🎯 Scopul tău principal
Trebuie să analizezi date istorice privind cursele dintre orașe și să înțelegi cum factori precum distanța, ora din zi, vremea, traficul sau experiența șoferului influențează durata efectivă a livrării.
Scopul tău este să construiești un model de Machine Learning capabil să prezică timpul estimat pentru curse noi.
📦 Datele de transport
Fiecare rând din fișierele train_data.csv
și test_data.csv
reprezintă o livrare între două orașe din România.
Fiecare livrare conține următoarele detalii:
Coloana | Descriere |
---|---|
ID | Identificator unic al cursei |
City A | Orașul de plecare (ca text) |
City B | Orașul de destinație (ca text) |
Distance | Distanța reală între orașe (în kilometri) |
Time of Day | Momentul zilei exprimat în minute de la miezul nopții când pleacă o cursa (0 - 1439) |
Weather | Vremea în timpul cursei (Clear , Rain , Snow , Fog ) |
Traffic | Nivelul traficului pe o scară numerică (0.0 - 1000.0), maximul înseamnă cel mai aglomerat |
Road Quality | Calitatea drumului pe o scară numerică (1 - 1000), maximul înseamnă cel mai calitativ |
Driver Experience | Nivelul de experiență al șoferului (1 - 40 ani) |
deliver_time | Doar în train_data.csv : timpul real de livrare în minute |
🎯 Misiunea ta
Managerul operațional ți-a dat următoarele două sarcini esențiale pentru îmbunătățirea operațiunilor „SmartCargo”.
Setul de Date pentru Predicție (test_data.csv
) conține eșantioane cu aceleași caracteristici ca setul de antrenament, dar fără coloana predicted_time
.
Modelul vostru va genera predicții pentru aceste eșantioane.
Subtask-uri
- Sarcina 1 (20p): Situația Bârlad: un client important din Bârlad a raportat întârzieri frecvente pe cursele în condiții de ceață. Managerul vrea să afle câte curse pleacă din Bârlad și pe vreme de ceață (
Fog
) în setul de date de predicție. Găsește și raportează numărul acestor curse. - Sarcina 2: Estimarea Timpilor pentru curse necunoscute: Managerul are o listă de noi curse pentru care nu știe timpii de deplasare. Trebuie să folosești datele istorice (din setul de antrenare) pentru a antrena modele de predicție și apoi să estimezi timpii de livrare pentru toate cursele din setul de date pentru predicție.
Format de ieșire
Un fișier csv output.csv
care să includă următoarele 3 coloane:
subtaskID
- reprezintă numărul subtaskului (1, 2)datapointID
- care se referă la coloanaID
dintest_data.csv
answer
- răspunsul corespunzător datapointului pentru subtaskul respectiv
Notă: Pentru subtask-ul 1, la care se cere un singur răspuns pentru tot setul de date, afișați o singură linie a cărei datapointID
să fie 1.
Trimiteți un singur csv care să conțină răspunsurile pentru toate subtask-urile pe care le-ați rezolvat. Pentru a vedea un exemplu, descărcați fișierul sample_output.csv
(Nota: acesta, desi in formatul corect, obtine 0 puncte la submisie).
Scor
Scorurile pentru subtask-uri se vor calcula după cum urmează:
- Subtask 1: răspuns întreg, primiți 20 de puncte doar dacă este corect.
- Subtask 2: în funcție de performanța modelului vostru, folosind metrica MAE (Mean Absolute Error) pe setul de date de testare. Puteți găsi modul exact de calcul al scorului bazat pe MAE în Starter Kit.
Submission
My submissions
Only submissions marked as final are counted for the complete leaderboard. Not choosing any final submissions will result in 0 points on this task.
Complete submission scores will be displayed after the competition ends