Simulare OJIA
O primă simulare a Olimpiadei Județene de Inteligență Artificială
Livrare pachete
Problema Prezicerii Livrării Pachetelor la Timp
În logistica modernă, livrarea la timp a pachetelor este esențială pentru satisfacția clienților și eficiența operațională.
Dezvoltați un model care să prezică dacă un pachet va fi livrat la timp (on_time = 1
) sau întârziat (on_time = 0
).
Veți antrena modelul folosind setul de date de antrenament furnizat și apoi veți genera predicții pentru un set de date ne-etichetat.
Descrierea Setului de Date
Setul de Date de Antrenament (train_data.csv
) conține următoarele coloane:
- id (număr natural): Numărul care identifică livrarea - număr natural unic.
- distance_km (0.5-700): Distanța de la depozit până la destinația de livrare (în kilometri). Distanțele mai scurte indică, în general, o probabilitate mai mare ca livrarea să fie la timp.
- package_weight_kg (0.5-150): Greutatea pachetului (în kilograme). Pachetele mai ușoare sunt, de obicei, livrate mai rapid.
- traffic_level (1-14): Un nivel al condițiilor de trafic (tip intreg, 1 - trafic redus, 14 - trafic aglomerat maxim).
- on_time: O variabilă binară în care
1
indică faptul că pachetul a fost livrat la timp, iar0
indică întârzierea.
Setul de Date pentru Predicție (test_data.csv
):
- Conține 50 de eșantioane cu aceleași caracteristici (
id
,distance_km
,package_weight_kg
șitraffic_level
) ca setul de antrenament, dar fără coloanaon_time
. - Modelul vostru va genera predicții pentru aceste eșantioane.
Rezultatul așteptat:
Un fisier csv output.csv
care să includă următoarele 4 coloane: pe prima coloană sunt id
-urile din test_data.csv
urmate de alte 3 coloane pentru următoarele 3 cerințe.
- P1 (20p):
mean_traffic_level
- reprezentând media nivelurilor de trafic din setul de date pentru predicție, precizie de 2 decimale (aceeași valoare pe întreaga coloană). - P2 (20p):
std_traffic_level
- reprezentând deviația standard a aceluiași câmp (nivelul de trafic), cu precizie de 2 decimale (aceeași valoare pe întreaga coloană). - P3 (60p):
on_time
- cu predicțiile modelului vostru,1
pentru livrare la timp, respectiv0
pentru întârziere.
Trimiteți un singur csv combinând fiecare id
cu răspunsul pentru fiecare subtask pe coloana corespunzătoare, ca în fișierul dat ca exemplu în sample_output.csv
Scor
Scorurile pentru subtask-uri se vor calcula după cum urmează:
- Subtask-urile 1 și 2: 20 de puncte dacă diferența de precizie între rezultatul vostru și cel al comisiei este de sub 0.02 și 0 altfel
- Subtask 3: round(min(max(60.0 * (acc - 0.8) / 0.178, 0), 60), 2), unde acc este acuratețea pe care ați obținut-o.
Această problemă nu are scor final diferit de scorul parțial. Scorul din timpul concursului e cel cu care veți rămâne la final.
Submission
My Submissions
This competition allows at most 50 submissions and up to 2 of those submissions can be chosen as final
You didn't make any submission yet
Livrare pachete
Problema Prezicerii Livrării Pachetelor la Timp
În logistica modernă, livrarea la timp a pachetelor este esențială pentru satisfacția clienților și eficiența operațională.
Dezvoltați un model care să prezică dacă un pachet va fi livrat la timp (on_time = 1
) sau întârziat (on_time = 0
).
Veți antrena modelul folosind setul de date de antrenament furnizat și apoi veți genera predicții pentru un set de date ne-etichetat.
Descrierea Setului de Date
Setul de Date de Antrenament (train_data.csv
) conține următoarele coloane:
- id (număr natural): Numărul care identifică livrarea - număr natural unic.
- distance_km (0.5-700): Distanța de la depozit până la destinația de livrare (în kilometri). Distanțele mai scurte indică, în general, o probabilitate mai mare ca livrarea să fie la timp.
- package_weight_kg (0.5-150): Greutatea pachetului (în kilograme). Pachetele mai ușoare sunt, de obicei, livrate mai rapid.
- traffic_level (1-14): Un nivel al condițiilor de trafic (tip intreg, 1 - trafic redus, 14 - trafic aglomerat maxim).
- on_time: O variabilă binară în care
1
indică faptul că pachetul a fost livrat la timp, iar0
indică întârzierea.
Setul de Date pentru Predicție (test_data.csv
):
- Conține 50 de eșantioane cu aceleași caracteristici (
id
,distance_km
,package_weight_kg
șitraffic_level
) ca setul de antrenament, dar fără coloanaon_time
. - Modelul vostru va genera predicții pentru aceste eșantioane.
Rezultatul așteptat:
Un fisier csv output.csv
care să includă următoarele 4 coloane: pe prima coloană sunt id
-urile din test_data.csv
urmate de alte 3 coloane pentru următoarele 3 cerințe.
- P1 (20p):
mean_traffic_level
- reprezentând media nivelurilor de trafic din setul de date pentru predicție, precizie de 2 decimale (aceeași valoare pe întreaga coloană). - P2 (20p):
std_traffic_level
- reprezentând deviația standard a aceluiași câmp (nivelul de trafic), cu precizie de 2 decimale (aceeași valoare pe întreaga coloană). - P3 (60p):
on_time
- cu predicțiile modelului vostru,1
pentru livrare la timp, respectiv0
pentru întârziere.
Trimiteți un singur csv combinând fiecare id
cu răspunsul pentru fiecare subtask pe coloana corespunzătoare, ca în fișierul dat ca exemplu în sample_output.csv
Scor
Scorurile pentru subtask-uri se vor calcula după cum urmează:
- Subtask-urile 1 și 2: 20 de puncte dacă diferența de precizie între rezultatul vostru și cel al comisiei este de sub 0.02 și 0 altfel
- Subtask 3: round(min(max(60.0 * (acc - 0.8) / 0.178, 0), 60), 2), unde acc este acuratețea pe care ați obținut-o.
Această problemă nu are scor final diferit de scorul parțial. Scorul din timpul concursului e cel cu care veți rămâne la final.
Submission
My Submissions
This competition allows at most 50 submissions and up to 2 of those submissions can be chosen as final
You didn't make any submission yet