Simulare OJIA 3
RO: A treia simulare a Olimpiadei Județene de Inteligență Artificială / EN: The third official simulation for the Romanian Regional Olympiad in Artificial Intelligence
Problema Admiterii la un liceu de elită
Un pas extrem de important în evoluția personală a fiecărui elev este admiterea la un liceu prestigios, de elită. Dezvoltați un model care prezice dacă pe baza mai multor rezultate candidatul va fi admis la un liceu de elită (status_admitere = 1) sau respins (status_admitere = 0). Veți antrena modelul folosind setul de date de antrenament train_data.csv furnizat și apoi veți genera predicții folosind setul de date test_data.csv.
Descrierea Setului de Date
Setul de Date pentru Antrenament (train_data.csv) conține următoarele coloane:
- id (număr natural): Numărul de identificare al candidatului - număr natural unic.
- gen(M sau F): genul candidatului – M sau genul candidatei – F.
- judet (șir de 2 caractere corespunzătoare județelor României): județul candidatului/ei.
- NT (1.00-10.00): nota la testul de admitere (tip float cu 2 zecimale).
- MEV (6.00-10.00): media la evaluare națională (tip float cu 2 zecimale).
- MATE (5.00-10.00): media din gimnaziu la matematică (tip float cu 2 zecimale).
- MGIM (5.00-10.00): media din gimnaziu (tip float cu 2 zecimale).
- status_admitere: o variabilă binară în care 1 indică admiterea candidatului, iar 0 indică respingerea candidatului.
Setul de Date pentru Predicție (test_data.csv):
- Conține 180 de eșantioane cu aceleași caracteristici (id, gen, judet, NT, MEV, MATE, MGIM) ca setul de antrenament, dar fără coloana status_admitere.
- Modelul vostru va genera predicții pentru aceste eșantioane.
Rezultatul așteptat:
Un fisier .csv, output.csv, care include următoarele 3 coloane, subtaskID, datapointID, answer, exact ca în sample_output.csv.
Valoarea de pe coloana answer conține răspunsul corect la subtaskul subtaskID pentru linia datapointID din test_data.csv.
- subtask1 (20 puncte): dif_NT-MEV - reprezentând diferența dintre nota la testul de admitere NT și nota la evaluarea națională MEV a candidatului, precizie de 2 decimale (valori diferite pentru fiecare rând).
- subtask2 (20 puncte): loc-MEV – reprezentând poziția în clasament a candidaților în funcție de nota obținută la evaluarea națională MEV (valori întregi diferite pe același rând).
- subtask3 (60p puncte): status_admitere - cu predicțiile modelului vostru, 1 pentru admitere, respectiv 0 pentru respingerea candidatului.
Scor
Trimiterea fișierului sample_output.csv va genera 5 puncte.
Observații
Eliminați coloanele care nu au relevanță pentru predicție, standardizați coloanele numerice, nu există rânduri incomplete, verificați detaliile orientative din secțiunea Starter Kit.
Submission
My submissions
Only submissions marked as final are counted for the complete leaderboard. Not choosing any final submissions will result in 0 points on this task.
Complete submission scores will be displayed after the competition ends
Problema Admiterii la un liceu de elită
Un pas extrem de important în evoluția personală a fiecărui elev este admiterea la un liceu prestigios, de elită. Dezvoltați un model care prezice dacă pe baza mai multor rezultate candidatul va fi admis la un liceu de elită (status_admitere = 1) sau respins (status_admitere = 0). Veți antrena modelul folosind setul de date de antrenament train_data.csv furnizat și apoi veți genera predicții folosind setul de date test_data.csv.
Descrierea Setului de Date
Setul de Date pentru Antrenament (train_data.csv) conține următoarele coloane:
- id (număr natural): Numărul de identificare al candidatului - număr natural unic.
- gen(M sau F): genul candidatului – M sau genul candidatei – F.
- judet (șir de 2 caractere corespunzătoare județelor României): județul candidatului/ei.
- NT (1.00-10.00): nota la testul de admitere (tip float cu 2 zecimale).
- MEV (6.00-10.00): media la evaluare națională (tip float cu 2 zecimale).
- MATE (5.00-10.00): media din gimnaziu la matematică (tip float cu 2 zecimale).
- MGIM (5.00-10.00): media din gimnaziu (tip float cu 2 zecimale).
- status_admitere: o variabilă binară în care 1 indică admiterea candidatului, iar 0 indică respingerea candidatului.
Setul de Date pentru Predicție (test_data.csv):
- Conține 180 de eșantioane cu aceleași caracteristici (id, gen, judet, NT, MEV, MATE, MGIM) ca setul de antrenament, dar fără coloana status_admitere.
- Modelul vostru va genera predicții pentru aceste eșantioane.
Rezultatul așteptat:
Un fisier .csv, output.csv, care include următoarele 3 coloane, subtaskID, datapointID, answer, exact ca în sample_output.csv.
Valoarea de pe coloana answer conține răspunsul corect la subtaskul subtaskID pentru linia datapointID din test_data.csv.
- subtask1 (20 puncte): dif_NT-MEV - reprezentând diferența dintre nota la testul de admitere NT și nota la evaluarea națională MEV a candidatului, precizie de 2 decimale (valori diferite pentru fiecare rând).
- subtask2 (20 puncte): loc-MEV – reprezentând poziția în clasament a candidaților în funcție de nota obținută la evaluarea națională MEV (valori întregi diferite pe același rând).
- subtask3 (60p puncte): status_admitere - cu predicțiile modelului vostru, 1 pentru admitere, respectiv 0 pentru respingerea candidatului.
Scor
Trimiterea fișierului sample_output.csv va genera 5 puncte.
Observații
Eliminați coloanele care nu au relevanță pentru predicție, standardizați coloanele numerice, nu există rânduri incomplete, verificați detaliile orientative din secțiunea Starter Kit.
Submission
My submissions
Only submissions marked as final are counted for the complete leaderboard. Not choosing any final submissions will result in 0 points on this task.
Complete submission scores will be displayed after the competition ends
Problema Admiterii la un liceu de elită
Un pas extrem de important în evoluția personală a fiecărui elev este admiterea la un liceu prestigios, de elită. Dezvoltați un model care prezice dacă pe baza mai multor rezultate candidatul va fi admis la un liceu de elită (status_admitere = 1) sau respins (status_admitere = 0). Veți antrena modelul folosind setul de date de antrenament train_data.csv furnizat și apoi veți genera predicții folosind setul de date test_data.csv.
Descrierea Setului de Date
Setul de Date pentru Antrenament (train_data.csv) conține următoarele coloane:
- id (număr natural): Numărul de identificare al candidatului - număr natural unic.
- gen(M sau F): genul candidatului – M sau genul candidatei – F.
- judet (șir de 2 caractere corespunzătoare județelor României): județul candidatului/ei.
- NT (1.00-10.00): nota la testul de admitere (tip float cu 2 zecimale).
- MEV (6.00-10.00): media la evaluare națională (tip float cu 2 zecimale).
- MATE (5.00-10.00): media din gimnaziu la matematică (tip float cu 2 zecimale).
- MGIM (5.00-10.00): media din gimnaziu (tip float cu 2 zecimale).
- status_admitere: o variabilă binară în care 1 indică admiterea candidatului, iar 0 indică respingerea candidatului.
Setul de Date pentru Predicție (test_data.csv):
- Conține 180 de eșantioane cu aceleași caracteristici (id, gen, judet, NT, MEV, MATE, MGIM) ca setul de antrenament, dar fără coloana status_admitere.
- Modelul vostru va genera predicții pentru aceste eșantioane.
Rezultatul așteptat:
Un fisier .csv, output.csv, care include următoarele 3 coloane, subtaskID, datapointID, answer, exact ca în sample_output.csv.
Valoarea de pe coloana answer conține răspunsul corect la subtaskul subtaskID pentru linia datapointID din test_data.csv.
- subtask1 (20 puncte): dif_NT-MEV - reprezentând diferența dintre nota la testul de admitere NT și nota la evaluarea națională MEV a candidatului, precizie de 2 decimale (valori diferite pentru fiecare rând).
- subtask2 (20 puncte): loc-MEV – reprezentând poziția în clasament a candidaților în funcție de nota obținută la evaluarea națională MEV (valori întregi diferite pe același rând).
- subtask3 (60p puncte): status_admitere - cu predicțiile modelului vostru, 1 pentru admitere, respectiv 0 pentru respingerea candidatului.
Scor
Trimiterea fișierului sample_output.csv va genera 5 puncte.
Observații
Eliminați coloanele care nu au relevanță pentru predicție, standardizați coloanele numerice, nu există rânduri incomplete, verificați detaliile orientative din secțiunea Starter Kit.
Submission
My submissions
Only submissions marked as final are counted for the complete leaderboard. Not choosing any final submissions will result in 0 points on this task.
Complete submission scores will be displayed after the competition ends
Problema Admiterii la un liceu de elită
Un pas extrem de important în evoluția personală a fiecărui elev este admiterea la un liceu prestigios, de elită. Dezvoltați un model care prezice dacă pe baza mai multor rezultate candidatul va fi admis la un liceu de elită (status_admitere = 1) sau respins (status_admitere = 0). Veți antrena modelul folosind setul de date de antrenament train_data.csv furnizat și apoi veți genera predicții folosind setul de date test_data.csv.
Descrierea Setului de Date
Setul de Date pentru Antrenament (train_data.csv) conține următoarele coloane:
- id (număr natural): Numărul de identificare al candidatului - număr natural unic.
- gen(M sau F): genul candidatului – M sau genul candidatei – F.
- judet (șir de 2 caractere corespunzătoare județelor României): județul candidatului/ei.
- NT (1.00-10.00): nota la testul de admitere (tip float cu 2 zecimale).
- MEV (6.00-10.00): media la evaluare națională (tip float cu 2 zecimale).
- MATE (5.00-10.00): media din gimnaziu la matematică (tip float cu 2 zecimale).
- MGIM (5.00-10.00): media din gimnaziu (tip float cu 2 zecimale).
- status_admitere: o variabilă binară în care 1 indică admiterea candidatului, iar 0 indică respingerea candidatului.
Setul de Date pentru Predicție (test_data.csv):
- Conține 180 de eșantioane cu aceleași caracteristici (id, gen, judet, NT, MEV, MATE, MGIM) ca setul de antrenament, dar fără coloana status_admitere.
- Modelul vostru va genera predicții pentru aceste eșantioane.
Rezultatul așteptat:
Un fisier .csv, output.csv, care include următoarele 3 coloane, subtaskID, datapointID, answer, exact ca în sample_output.csv.
Valoarea de pe coloana answer conține răspunsul corect la subtaskul subtaskID pentru linia datapointID din test_data.csv.
- subtask1 (20 puncte): dif_NT-MEV - reprezentând diferența dintre nota la testul de admitere NT și nota la evaluarea națională MEV a candidatului, precizie de 2 decimale (valori diferite pentru fiecare rând).
- subtask2 (20 puncte): loc-MEV – reprezentând poziția în clasament a candidaților în funcție de nota obținută la evaluarea națională MEV (valori întregi diferite pe același rând).
- subtask3 (60p puncte): status_admitere - cu predicțiile modelului vostru, 1 pentru admitere, respectiv 0 pentru respingerea candidatului.
Scor
Trimiterea fișierului sample_output.csv va genera 5 puncte.
Observații
Eliminați coloanele care nu au relevanță pentru predicție, standardizați coloanele numerice, nu există rânduri incomplete, verificați detaliile orientative din secțiunea Starter Kit.
Submission
My submissions
Only submissions marked as final are counted for the complete leaderboard. Not choosing any final submissions will result in 0 points on this task.
Complete submission scores will be displayed after the competition ends