logo
ALPHA
Competitions

Simulare OJIA

High-school
Romania
Individual

O primă simulare a Olimpiadei Județene de Inteligență Artificială

Problems Communication Leaderboard Rules
Livrare pacheteCredit Score
TaskEditorial

Livrare pachete

Problema Prezicerii Livrării Pachetelor la Timp

În logistica modernă, livrarea la timp a pachetelor este esențială pentru satisfacția clienților și eficiența operațională. Dezvoltați un model care să prezică dacă un pachet va fi livrat la timp (on_time = 1) sau întârziat (on_time = 0).

Veți antrena modelul folosind setul de date de antrenament furnizat și apoi veți genera predicții pentru un set de date ne-etichetat.

Descrierea Setului de Date

Setul de Date de Antrenament (train_data.csv) conține următoarele coloane:

  • id (număr natural): Numărul care identifică livrarea - număr natural unic.
  • distance_km (0.5-700): Distanța de la depozit până la destinația de livrare (în kilometri). Distanțele mai scurte indică, în general, o probabilitate mai mare ca livrarea să fie la timp.
  • package_weight_kg (0.5-150): Greutatea pachetului (în kilograme). Pachetele mai ușoare sunt, de obicei, livrate mai rapid.
  • traffic_level (1-14): Un nivel al condițiilor de trafic (tip intreg, 1 - trafic redus, 14 - trafic aglomerat maxim).
  • on_time: O variabilă binară în care 1 indică faptul că pachetul a fost livrat la timp, iar 0 indică întârzierea.

Setul de Date pentru Predicție (test_data.csv):

  • Conține 50 de eșantioane cu aceleași caracteristici (id, distance_km, package_weight_kg și traffic_level) ca setul de antrenament, dar fără coloana on_time.
  • Modelul vostru va genera predicții pentru aceste eșantioane.

Rezultatul așteptat:

Un fisier csv output.csv care să includă următoarele 4 coloane: pe prima coloană sunt id-urile din test_data.csv urmate de alte 3 coloane pentru următoarele 3 cerințe.

  • P1 (20p): mean_traffic_level - reprezentând media nivelurilor de trafic din setul de date pentru predicție, precizie de 2 decimale (aceeași valoare pe întreaga coloană).
  • P2 (20p): std_traffic_level - reprezentând deviația standard a aceluiași câmp (nivelul de trafic), cu precizie de 2 decimale (aceeași valoare pe întreaga coloană).
  • P3 (60p): on_time - cu predicțiile modelului vostru, 1 pentru livrare la timp, respectiv 0 pentru întârziere.

Trimiteți un singur csv combinând fiecare id cu răspunsul pentru fiecare subtask pe coloana corespunzătoare, ca în fișierul dat ca exemplu în sample_output.csv

Scor

Scorurile pentru subtask-uri se vor calcula după cum urmează:

  • Subtask-urile 1 și 2: 20 de puncte dacă diferența de precizie între rezultatul vostru și cel al comisiei este de sub 0.02 și 0 altfel
  • Subtask 3: round(min(max(60.0 * (acc - 0.8) / 0.178, 0), 60), 2), unde acc este acuratețea pe care ați obținut-o.

Această problemă nu are scor final diferit de scorul parțial. Scorul din timpul concursului e cel cu care veți rămâne la final.

Files

Train DataTest DataSample OutputStarter Kit

Submission

Make sure your source code produces the output you uploaded! Chosen submissions may be rerun with your source code after the competition to get the final score.

My Submissions

This competition allows at most 50 submissions and up to 2 of those submissions can be chosen as final

You didn't make any submission yet