Nitro AI Judge

Simulare OJIA 1

High-school

Romania

Individual

RO: Prima simulare a Olimpiadei Județene de Inteligență Artificială / EN: The first official simulation for the Romanian Regional Olympiad in Artificial Intelligence

Problems Communication Leaderboard Rules

Livrare pachete Credit Score

Task Editorial

Credit Score

Prezentare generală

Setul de date utilizat pentru această provocare provine de la o bancă și conține informații despre utilizatori, având ca scop prezicerea dacă un utilizator este un bun platnic. Problema este una de clasificare cu 3 posible etichete asociate unui client: POOR CREDIT SCORE, codificat prin valoarea -1, STANDARD CREDIT SCORE, codificat prin valoarea 0 și GOOD CREDIT SCORE, codificat prin valoarea 1.

Prezentarea setului de date

Setul de date din fișierul train_data.csv conține următoarele coloane:

ID: cod de identificare unic în hexazecimal a fiecărei linii
Customer_ID: cod de identificare unic al clientului
Month: luna din an
Name: numele clientului
Age: vârsta clientului exprimată în ani
SSN: cod numeric personal al clientului
Occupation: ocupația clientului
Annual_Income: venitul anul al clientului
Monthly_Inhand_Salary: salariul lunar net al clientului
Num_Bank_Accounts: numărul de conturi bancare ale clientului
Num_Credit_Card: numărul de carduri de credit pe care le deține clientul
Interest_Rate: dobânda
Num_of_Loan: numărul de împrumuturi ale clientului
Type_of_Loan: o listă care conține tipurile acestor împrumuturi
Delay_from_due_date: întârzierea față de data scadentă
Num_of_Delayed_Payment: numărul de plați efectuate cu întârziere
Changed_Credit_Limit
Num_Credit_Inquiries
Credit_Mix
Outstanding_Debt
Credit_Utilization_Ratio
Credit_History_Age
Payment_of_Min_Amount
Total_EMI_per_month
Amount_invested_monthly
Payment_Behaviour
Monthly_Balance
Credit_Score: una dintre cele 3 etichete posibile asociate unui client

Setul de date din fișierul test_data.csv va conține aceleași coloane fără coloana Credit_Score.

Cerință

Subtask 1:

Câte linii de intrare sunt in fișierul train_data.csv?

Subtask 2:

Bazat pe datele fișierul train_data.csv , care este media pentru "Salariul în mână" (Monthly_Inhand_Salary) al clienților care au un Credit_Utilization_Ratio mai mare sau egal cu 25? Afișați partea întreagă inferioară a acestei medii.

Subtask 3:

Bazat pe datele fișierul train_data.csv , câte valori unice sunt înregistrate pentru atributul Month?

Subtask 4:

Bazat pe datele fișierul train_data.csv , câte valori unice ale atributului SSN care se termină în 20 există?

Subtask 5:

Construiește un model de învățare automată pentru a prezice scorul de credit pentru fiecare înregistrare din setul de date de test (test_data.csv).

Format de ieșire

Fișierul de ieșire încărcat de tip .csv trebuie să conțină 3 coloane:

subtaskID - reprezintă numărul subtaskului (1, 2, 3, 4 sau 5)
datapointID - care se referă la coloana id din test_data.csv
answer - răspunsul corespunzător datapointului pentru subtaskul respectiv

Notă: Pentru subtask-urile 1-4, la care se cere un singur răspuns pentru tot setul de date, afișați o singură linie a cărei datapointID să fie 1. Pentru subtask-ul 5, răspunsurile trebuie să fie valori din mulțimea { -1, 0, 1 } corespunzătoare etichetei atribuite clientului.

Trimiteți un singur csv care să conțină răspunsurile pentru toate subtask-urile pe care le-ați rezolvat. Pentru a vedea un exemplu, descărcați fișierul sample_output.csv

Scor

Subtask 1: 4 puncte
Subtask 2: 5 puncte
Subtask 3: 5 puncte
Subtask 4: 6 puncte

La subtask-ul 5, veți fi punctați în funcție de acuratețe (notată mai jos acc) după cum urmează:

acc < 0.4 => 0 puncte
0.4 <= acc < 0.5 => 10 puncte
0.5 <= acc < 0.6 => 25 puncte
0.6 <= acc < 0.7 => 55 puncte
0.7 <= acc < 0.75 => 65 puncte
0.75 <= acc => 80 puncte

Editorial

https://github.com/Olimpiada-AI/Editoriale/tree/main/SimulareOJIA-1-2025/CreditScore

Files

Train Data Test Data Sample Output Starter Kit

Submission

My submissions

Only submissions marked as final are counted for the complete leaderboard. Not choosing any final submissions will result in 0 points on this task.

Showing partial scores

Complete submission scores will be displayed after the competition ends

Credit Score

Prezentare generală

Prezentarea setului de date

Setul de date din fișierul train_data.csv conține următoarele coloane:

ID: cod de identificare unic în hexazecimal a fiecărei linii
Customer_ID: cod de identificare unic al clientului
Month: luna din an
Name: numele clientului
Age: vârsta clientului exprimată în ani
SSN: cod numeric personal al clientului
Occupation: ocupația clientului
Annual_Income: venitul anul al clientului
Monthly_Inhand_Salary: salariul lunar net al clientului
Num_Bank_Accounts: numărul de conturi bancare ale clientului
Num_Credit_Card: numărul de carduri de credit pe care le deține clientul
Interest_Rate: dobânda
Num_of_Loan: numărul de împrumuturi ale clientului
Type_of_Loan: o listă care conține tipurile acestor împrumuturi
Delay_from_due_date: întârzierea față de data scadentă
Num_of_Delayed_Payment: numărul de plați efectuate cu întârziere
Changed_Credit_Limit
Num_Credit_Inquiries
Credit_Mix
Outstanding_Debt
Credit_Utilization_Ratio
Credit_History_Age
Payment_of_Min_Amount
Total_EMI_per_month
Amount_invested_monthly
Payment_Behaviour
Monthly_Balance
Credit_Score: una dintre cele 3 etichete posibile asociate unui client

Setul de date din fișierul test_data.csv va conține aceleași coloane fără coloana Credit_Score.

Cerință

Subtask 1:

Câte linii de intrare sunt in fișierul train_data.csv?

Subtask 2:

Subtask 3:

Bazat pe datele fișierul train_data.csv , câte valori unice sunt înregistrate pentru atributul Month?

Subtask 4:

Bazat pe datele fișierul train_data.csv , câte valori unice ale atributului SSN care se termină în 20 există?

Subtask 5:

Construiește un model de învățare automată pentru a prezice scorul de credit pentru fiecare înregistrare din setul de date de test (test_data.csv).

Format de ieșire

Fișierul de ieșire încărcat de tip .csv trebuie să conțină 3 coloane:

subtaskID - reprezintă numărul subtaskului (1, 2, 3, 4 sau 5)
datapointID - care se referă la coloana id din test_data.csv
answer - răspunsul corespunzător datapointului pentru subtaskul respectiv

Trimiteți un singur csv care să conțină răspunsurile pentru toate subtask-urile pe care le-ați rezolvat. Pentru a vedea un exemplu, descărcați fișierul sample_output.csv

Scor

Subtask 1: 4 puncte
Subtask 2: 5 puncte
Subtask 3: 5 puncte
Subtask 4: 6 puncte

La subtask-ul 5, veți fi punctați în funcție de acuratețe (notată mai jos acc) după cum urmează:

acc < 0.4 => 0 puncte
0.4 <= acc < 0.5 => 10 puncte
0.5 <= acc < 0.6 => 25 puncte
0.6 <= acc < 0.7 => 55 puncte
0.7 <= acc < 0.75 => 65 puncte
0.75 <= acc => 80 puncte

Editorial

https://github.com/Olimpiada-AI/Editoriale/tree/main/SimulareOJIA-1-2025/CreditScore

Files

Train Data Test Data Sample Output Starter Kit

Submission

My submissions

Only submissions marked as final are counted for the complete leaderboard. Not choosing any final submissions will result in 0 points on this task.

Showing partial scores

Complete submission scores will be displayed after the competition ends

Task Editorial

Credit Score

Prezentare generală

Prezentarea setului de date

Setul de date din fișierul train_data.csv conține următoarele coloane:

ID: cod de identificare unic în hexazecimal a fiecărei linii
Customer_ID: cod de identificare unic al clientului
Month: luna din an
Name: numele clientului
Age: vârsta clientului exprimată în ani
SSN: cod numeric personal al clientului
Occupation: ocupația clientului
Annual_Income: venitul anul al clientului
Monthly_Inhand_Salary: salariul lunar net al clientului
Num_Bank_Accounts: numărul de conturi bancare ale clientului
Num_Credit_Card: numărul de carduri de credit pe care le deține clientul
Interest_Rate: dobânda
Num_of_Loan: numărul de împrumuturi ale clientului
Type_of_Loan: o listă care conține tipurile acestor împrumuturi
Delay_from_due_date: întârzierea față de data scadentă
Num_of_Delayed_Payment: numărul de plați efectuate cu întârziere
Changed_Credit_Limit
Num_Credit_Inquiries
Credit_Mix
Outstanding_Debt
Credit_Utilization_Ratio
Credit_History_Age
Payment_of_Min_Amount
Total_EMI_per_month
Amount_invested_monthly
Payment_Behaviour
Monthly_Balance
Credit_Score: una dintre cele 3 etichete posibile asociate unui client

Setul de date din fișierul test_data.csv va conține aceleași coloane fără coloana Credit_Score.

Cerință

Subtask 1:

Câte linii de intrare sunt in fișierul train_data.csv?

Subtask 2:

Subtask 3:

Bazat pe datele fișierul train_data.csv , câte valori unice sunt înregistrate pentru atributul Month?

Subtask 4:

Bazat pe datele fișierul train_data.csv , câte valori unice ale atributului SSN care se termină în 20 există?

Subtask 5:

Construiește un model de învățare automată pentru a prezice scorul de credit pentru fiecare înregistrare din setul de date de test (test_data.csv).

Format de ieșire

Fișierul de ieșire încărcat de tip .csv trebuie să conțină 3 coloane:

subtaskID - reprezintă numărul subtaskului (1, 2, 3, 4 sau 5)
datapointID - care se referă la coloana id din test_data.csv
answer - răspunsul corespunzător datapointului pentru subtaskul respectiv

Trimiteți un singur csv care să conțină răspunsurile pentru toate subtask-urile pe care le-ați rezolvat. Pentru a vedea un exemplu, descărcați fișierul sample_output.csv

Scor

Subtask 1: 4 puncte
Subtask 2: 5 puncte
Subtask 3: 5 puncte
Subtask 4: 6 puncte

La subtask-ul 5, veți fi punctați în funcție de acuratețe (notată mai jos acc) după cum urmează:

acc < 0.4 => 0 puncte
0.4 <= acc < 0.5 => 10 puncte
0.5 <= acc < 0.6 => 25 puncte
0.6 <= acc < 0.7 => 55 puncte
0.7 <= acc < 0.75 => 65 puncte
0.75 <= acc => 80 puncte

Editorial

https://github.com/Olimpiada-AI/Editoriale/tree/main/SimulareOJIA-1-2025/CreditScore

Files

Train Data Test Data Sample Output Starter Kit

Submission

My submissions

Only submissions marked as final are counted for the complete leaderboard. Not choosing any final submissions will result in 0 points on this task.

Showing partial scores

Complete submission scores will be displayed after the competition ends

Credit Score

Prezentare generală

Prezentarea setului de date

Setul de date din fișierul train_data.csv conține următoarele coloane:

ID: cod de identificare unic în hexazecimal a fiecărei linii
Customer_ID: cod de identificare unic al clientului
Month: luna din an
Name: numele clientului
Age: vârsta clientului exprimată în ani
SSN: cod numeric personal al clientului
Occupation: ocupația clientului
Annual_Income: venitul anul al clientului
Monthly_Inhand_Salary: salariul lunar net al clientului
Num_Bank_Accounts: numărul de conturi bancare ale clientului
Num_Credit_Card: numărul de carduri de credit pe care le deține clientul
Interest_Rate: dobânda
Num_of_Loan: numărul de împrumuturi ale clientului
Type_of_Loan: o listă care conține tipurile acestor împrumuturi
Delay_from_due_date: întârzierea față de data scadentă
Num_of_Delayed_Payment: numărul de plați efectuate cu întârziere
Changed_Credit_Limit
Num_Credit_Inquiries
Credit_Mix
Outstanding_Debt
Credit_Utilization_Ratio
Credit_History_Age
Payment_of_Min_Amount
Total_EMI_per_month
Amount_invested_monthly
Payment_Behaviour
Monthly_Balance
Credit_Score: una dintre cele 3 etichete posibile asociate unui client

Setul de date din fișierul test_data.csv va conține aceleași coloane fără coloana Credit_Score.

Cerință

Subtask 1:

Câte linii de intrare sunt in fișierul train_data.csv?

Subtask 2:

Subtask 3:

Bazat pe datele fișierul train_data.csv , câte valori unice sunt înregistrate pentru atributul Month?

Subtask 4:

Bazat pe datele fișierul train_data.csv , câte valori unice ale atributului SSN care se termină în 20 există?

Subtask 5:

Construiește un model de învățare automată pentru a prezice scorul de credit pentru fiecare înregistrare din setul de date de test (test_data.csv).

Format de ieșire

Fișierul de ieșire încărcat de tip .csv trebuie să conțină 3 coloane:

subtaskID - reprezintă numărul subtaskului (1, 2, 3, 4 sau 5)
datapointID - care se referă la coloana id din test_data.csv
answer - răspunsul corespunzător datapointului pentru subtaskul respectiv

Trimiteți un singur csv care să conțină răspunsurile pentru toate subtask-urile pe care le-ați rezolvat. Pentru a vedea un exemplu, descărcați fișierul sample_output.csv

Scor

Subtask 1: 4 puncte
Subtask 2: 5 puncte
Subtask 3: 5 puncte
Subtask 4: 6 puncte

La subtask-ul 5, veți fi punctați în funcție de acuratețe (notată mai jos acc) după cum urmează:

acc < 0.4 => 0 puncte
0.4 <= acc < 0.5 => 10 puncte
0.5 <= acc < 0.6 => 25 puncte
0.6 <= acc < 0.7 => 55 puncte
0.7 <= acc < 0.75 => 65 puncte
0.75 <= acc => 80 puncte

Editorial

https://github.com/Olimpiada-AI/Editoriale/tree/main/SimulareOJIA-1-2025/CreditScore

Files

Train Data Test Data Sample Output Starter Kit

Submission

My submissions

Only submissions marked as final are counted for the complete leaderboard. Not choosing any final submissions will result in 0 points on this task.

Showing partial scores

Complete submission scores will be displayed after the competition ends