logo
ALPHA
Competitions
thumbnail

Simulare OJIA 3

High-school
Romania
Individual

RO: A treia simulare a Olimpiadei Județene de Inteligență Artificială / EN: The third official simulation for the Romanian Regional Olympiad in Artificial Intelligence

Problems Communication Leaderboard Rules
Problema Admiterii la un liceu de elităPredicția scorului la examen
TaskEditorial

Problema Admiterii la un liceu de elită

Un pas extrem de important în evoluția personală a fiecărui elev este admiterea la un liceu prestigios, de elită. Dezvoltați un model care prezice dacă pe baza mai multor rezultate candidatul va fi admis la un liceu de elită (status_admitere = 1) sau respins (status_admitere = 0). Veți antrena modelul folosind setul de date de antrenament train_data.csv furnizat și apoi veți genera predicții folosind setul de date test_data.csv.

Descrierea Setului de Date

Setul de Date pentru Antrenament (train_data.csv) conține următoarele coloane:

  • id (număr natural): Numărul de identificare al candidatului - număr natural unic.
  • gen(M sau F): genul candidatului – M sau genul candidatei – F.
  • judet (șir de 2 caractere corespunzătoare județelor României): județul candidatului/ei.
  • NT (1.00-10.00): nota la testul de admitere (tip float cu 2 zecimale).
  • MEV (6.00-10.00): media la evaluare națională (tip float cu 2 zecimale).
  • MATE (5.00-10.00): media din gimnaziu la matematică (tip float cu 2 zecimale).
  • MGIM (5.00-10.00): media din gimnaziu (tip float cu 2 zecimale).
  • status_admitere: o variabilă binară în care 1 indică admiterea candidatului, iar 0 indică respingerea candidatului.

Setul de Date pentru Predicție (test_data.csv):

  • Conține 180 de eșantioane cu aceleași caracteristici (id, gen, judet, NT, MEV, MATE, MGIM) ca setul de antrenament, dar fără coloana status_admitere.
  • Modelul vostru va genera predicții pentru aceste eșantioane.

Rezultatul așteptat:

Un fisier .csv, output.csv, care include următoarele 3 coloane, subtaskID, datapointID, answer, exact ca în sample_output.csv.

Valoarea de pe coloana answer conține răspunsul corect la subtaskul subtaskID pentru linia datapointID din test_data.csv.

  • subtask1 (20 puncte): dif_NT-MEV - reprezentând diferența dintre nota la testul de admitere NT și nota la evaluarea națională MEV a candidatului, precizie de 2 decimale (valori diferite pentru fiecare rând).
  • subtask2 (20 puncte): loc-MEV – reprezentând poziția în clasament a candidaților în funcție de nota obținută la evaluarea națională MEV (valori întregi diferite pe același rând).
  • subtask3 (60p puncte): status_admitere - cu predicțiile modelului vostru, 1 pentru admitere, respectiv 0 pentru respingerea candidatului.

Scor

Trimiterea fișierului sample_output.csv va genera 5 puncte.

Observații

Eliminați coloanele care nu au relevanță pentru predicție, standardizați coloanele numerice, nu există rânduri incomplete, verificați detaliile orientative din secțiunea Starter Kit.

Files

Train DataTest DataSample OutputStarter Kit

Submission

Make sure your source code produces the output you uploaded! Chosen submissions may be rerun with your source code after the competition to get the final score.

My submissions

Only submissions marked as final are counted for the complete leaderboard. Not choosing any final submissions will result in 0 points on this task.

Complete submission scores will be displayed after the competition ends