logo
ALPHA
Competitions
thumbnail

Simulare OJIA 1

High-school
Romania
Individual

RO: Prima simulare a Olimpiadei Județene de Inteligență Artificială / EN: The first official simulation for the Romanian Regional Olympiad in Artificial Intelligence

Problems Communication Leaderboard Rules
Livrare pacheteCredit Score
TaskEditorial

Livrare pachete

Problema Prezicerii Livrării Pachetelor la Timp

În logistica modernă, livrarea la timp a pachetelor este esențială pentru satisfacția clienților și eficiența operațională. Dezvoltați un model care să prezică dacă un pachet va fi livrat la timp (on_time = 1) sau întârziat (on_time = 0).

Veți antrena modelul folosind setul de date de antrenament furnizat și apoi veți genera predicții pentru un set de date ne-etichetat.

Descrierea Setului de Date

Setul de Date de Antrenament (train_data.csv) conține următoarele coloane:

  • id (număr natural): Numărul care identifică livrarea - număr natural unic.
  • distance_km (0.5-700): Distanța de la depozit până la destinația de livrare (în kilometri). Distanțele mai scurte indică, în general, o probabilitate mai mare ca livrarea să fie la timp.
  • package_weight_kg (0.5-150): Greutatea pachetului (în kilograme). Pachetele mai ușoare sunt, de obicei, livrate mai rapid.
  • traffic_level (1-14): Un nivel al condițiilor de trafic (tip intreg, 1 - trafic redus, 14 - trafic aglomerat maxim).
  • on_time: O variabilă binară în care 1 indică faptul că pachetul a fost livrat la timp, iar 0 indică întârzierea.

Setul de Date pentru Predicție (test_data.csv):

  • Conține 50 de eșantioane cu aceleași caracteristici (id, distance_km, package_weight_kg și traffic_level) ca setul de antrenament, dar fără coloana on_time.
  • Modelul vostru va genera predicții pentru aceste eșantioane.

Subtask-uri

  • Subtask 1 (20p): mean_traffic_level - reprezentând media nivelurilor de trafic din setul de date pentru predicție, precizie de 2 decimale
  • Subtask 2 (20p): std_traffic_level - reprezentând deviația standard a aceluiași câmp (nivelul de trafic), cu precizie de 2 decimale
  • Subtask 3 (60p): on_time - cu predicțiile modelului vostru, 1 pentru livrare la timp, respectiv 0 pentru întârziere.

Rezultatul așteptat:

Un fisier csv output.csv care să includă următoarele 3 coloane:

  • subtaskID - reprezintă numărul subtaskului (1, 2 sau 3)
  • datapointID - care se referă la coloana id din test_data.csv
  • answer - răspunsul corespunzător datapointului pentru subtaskul respectiv

Notă: Pentru subtask-urile 1 și 2, la care se cere un singur răspuns pentru tot setul de date, afișați o singură linie a cărei datapointID să fie 1.

Trimiteți un singur csv care să conțină răspunsurile pentru toate subtask-urile pe care le-ați rezolvat. Pentru a vedea un exemplu, descărcați fișierul sample_output.csv

Scor

Scorurile pentru subtask-uri se vor calcula după cum urmează:

  • Subtask-urile 1 și 2: 20 de puncte dacă diferența de precizie între rezultatul vostru și cel al comisiei este de sub 0.02 și 0 altfel
  • Subtask 3: round(min(max(60.0 * (acc - 0.8) / 0.178, 0), 60), 2), unde acc este acuratețea pe care ați obținut-o.

Această problemă nu are scor final diferit de scorul parțial. Scorul din timpul concursului e cel cu care veți rămâne la final.

Files

Train DataTest DataSample OutputStarter Kit

Submission

Make sure your source code produces the output you uploaded! Chosen submissions may be rerun with your source code after the competition to get the final score.

My submissions

Only submissions marked as final are counted for the complete leaderboard. Not choosing any final submissions will result in 0 points on this task.

Complete submission scores will be displayed after the competition ends