Simulare OJIA 1
RO: Prima simulare a Olimpiadei Județene de Inteligență Artificială / EN: The first official simulation for the Romanian Regional Olympiad in Artificial Intelligence
Credit Score
Prezentare generală
Setul de date utilizat pentru această provocare provine de la o bancă și conține informații despre utilizatori, având ca scop prezicerea dacă un utilizator este un bun platnic. Problema este una de clasificare cu 3 posible etichete asociate unui client: POOR CREDIT SCORE
, codificat prin valoarea -1, STANDARD CREDIT SCORE
, codificat prin valoarea 0 și GOOD CREDIT SCORE
, codificat prin valoarea 1.
Prezentarea setului de date
Setul de date din fișierul train_data.csv
conține următoarele coloane:
- ID: cod de identificare unic în hexazecimal a fiecărei linii
- Customer_ID: cod de identificare unic al clientului
- Month: luna din an
- Name: numele clientului
- Age: vârsta clientului exprimată în ani
- SSN: cod numeric personal al clientului
- Occupation: ocupația clientului
- Annual_Income: venitul anul al clientului
- Monthly_Inhand_Salary: salariul lunar net al clientului
- Num_Bank_Accounts: numărul de conturi bancare ale clientului
- Num_Credit_Card: numărul de carduri de credit pe care le deține clientul
- Interest_Rate: dobânda
- Num_of_Loan: numărul de împrumuturi ale clientului
- Type_of_Loan: o listă care conține tipurile acestor împrumuturi
- Delay_from_due_date: întârzierea față de data scadentă
- Num_of_Delayed_Payment: numărul de plați efectuate cu întârziere
- Changed_Credit_Limit
- Num_Credit_Inquiries
- Credit_Mix
- Outstanding_Debt
- Credit_Utilization_Ratio
- Credit_History_Age
- Payment_of_Min_Amount
- Total_EMI_per_month
- Amount_invested_monthly
- Payment_Behaviour
- Monthly_Balance
- Credit_Score: una dintre cele 3 etichete posibile asociate unui client
Setul de date din fișierul test_data.csv
va conține aceleași coloane fără coloana Credit_Score
.
Cerință
Subtask 1:
Câte linii de intrare sunt in fișierul train_data.csv
?
Subtask 2:
Bazat pe datele fișierul train_data.csv
, care este media pentru "Salariul în mână" (Monthly_Inhand_Salary
) al clienților care au un Credit_Utilization_Ratio
mai mare sau egal cu 25? Afișați partea întreagă inferioară a acestei medii.
Subtask 3:
Bazat pe datele fișierul train_data.csv
, câte valori unice sunt înregistrate pentru atributul Month
?
Subtask 4:
Bazat pe datele fișierul train_data.csv
, câte valori unice ale atributului SSN
care se termină în 20
există?
Subtask 5:
Construiește un model de învățare automată pentru a prezice scorul de credit pentru fiecare înregistrare din setul de date de test (test_data.csv
).
Format de ieșire
Fișierul de ieșire încărcat de tip .csv
trebuie să conțină 3 coloane:
subtaskID
- reprezintă numărul subtaskului (1, 2, 3, 4 sau 5)datapointID
- care se referă la coloanaid
dintest_data.csv
answer
- răspunsul corespunzător datapointului pentru subtaskul respectiv
Notă: Pentru subtask-urile 1-4, la care se cere un singur răspuns pentru tot setul de date, afișați o singură linie a cărei datapointID
să fie 1. Pentru subtask-ul 5, răspunsurile trebuie să fie valori din mulțimea { -1, 0, 1 } corespunzătoare etichetei atribuite clientului.
Trimiteți un singur csv care să conțină răspunsurile pentru toate subtask-urile pe care le-ați rezolvat. Pentru a vedea un exemplu, descărcați fișierul sample_output.csv
Scor
- Subtask 1: 4 puncte
- Subtask 2: 5 puncte
- Subtask 3: 5 puncte
- Subtask 4: 6 puncte
La subtask-ul 5, veți fi punctați în funcție de acuratețe (notată mai jos acc) după cum urmează:
- acc < 0.4 => 0 puncte
- 0.4 <= acc < 0.5 => 10 puncte
- 0.5 <= acc < 0.6 => 25 puncte
- 0.6 <= acc < 0.7 => 55 puncte
- 0.7 <= acc < 0.75 => 65 puncte
- 0.75 <= acc => 80 puncte
Editorial
https://github.com/Olimpiada-AI/Editoriale/tree/main/SimulareOJIA-1-2025/CreditScore
Submission
My submissions
Only submissions marked as final are counted for the complete leaderboard. Not choosing any final submissions will result in 0 points on this task.
Complete submission scores will be displayed after the competition ends
Credit Score
Prezentare generală
Setul de date utilizat pentru această provocare provine de la o bancă și conține informații despre utilizatori, având ca scop prezicerea dacă un utilizator este un bun platnic. Problema este una de clasificare cu 3 posible etichete asociate unui client: POOR CREDIT SCORE
, codificat prin valoarea -1, STANDARD CREDIT SCORE
, codificat prin valoarea 0 și GOOD CREDIT SCORE
, codificat prin valoarea 1.
Prezentarea setului de date
Setul de date din fișierul train_data.csv
conține următoarele coloane:
- ID: cod de identificare unic în hexazecimal a fiecărei linii
- Customer_ID: cod de identificare unic al clientului
- Month: luna din an
- Name: numele clientului
- Age: vârsta clientului exprimată în ani
- SSN: cod numeric personal al clientului
- Occupation: ocupația clientului
- Annual_Income: venitul anul al clientului
- Monthly_Inhand_Salary: salariul lunar net al clientului
- Num_Bank_Accounts: numărul de conturi bancare ale clientului
- Num_Credit_Card: numărul de carduri de credit pe care le deține clientul
- Interest_Rate: dobânda
- Num_of_Loan: numărul de împrumuturi ale clientului
- Type_of_Loan: o listă care conține tipurile acestor împrumuturi
- Delay_from_due_date: întârzierea față de data scadentă
- Num_of_Delayed_Payment: numărul de plați efectuate cu întârziere
- Changed_Credit_Limit
- Num_Credit_Inquiries
- Credit_Mix
- Outstanding_Debt
- Credit_Utilization_Ratio
- Credit_History_Age
- Payment_of_Min_Amount
- Total_EMI_per_month
- Amount_invested_monthly
- Payment_Behaviour
- Monthly_Balance
- Credit_Score: una dintre cele 3 etichete posibile asociate unui client
Setul de date din fișierul test_data.csv
va conține aceleași coloane fără coloana Credit_Score
.
Cerință
Subtask 1:
Câte linii de intrare sunt in fișierul train_data.csv
?
Subtask 2:
Bazat pe datele fișierul train_data.csv
, care este media pentru "Salariul în mână" (Monthly_Inhand_Salary
) al clienților care au un Credit_Utilization_Ratio
mai mare sau egal cu 25? Afișați partea întreagă inferioară a acestei medii.
Subtask 3:
Bazat pe datele fișierul train_data.csv
, câte valori unice sunt înregistrate pentru atributul Month
?
Subtask 4:
Bazat pe datele fișierul train_data.csv
, câte valori unice ale atributului SSN
care se termină în 20
există?
Subtask 5:
Construiește un model de învățare automată pentru a prezice scorul de credit pentru fiecare înregistrare din setul de date de test (test_data.csv
).
Format de ieșire
Fișierul de ieșire încărcat de tip .csv
trebuie să conțină 3 coloane:
subtaskID
- reprezintă numărul subtaskului (1, 2, 3, 4 sau 5)datapointID
- care se referă la coloanaid
dintest_data.csv
answer
- răspunsul corespunzător datapointului pentru subtaskul respectiv
Notă: Pentru subtask-urile 1-4, la care se cere un singur răspuns pentru tot setul de date, afișați o singură linie a cărei datapointID
să fie 1. Pentru subtask-ul 5, răspunsurile trebuie să fie valori din mulțimea { -1, 0, 1 } corespunzătoare etichetei atribuite clientului.
Trimiteți un singur csv care să conțină răspunsurile pentru toate subtask-urile pe care le-ați rezolvat. Pentru a vedea un exemplu, descărcați fișierul sample_output.csv
Scor
- Subtask 1: 4 puncte
- Subtask 2: 5 puncte
- Subtask 3: 5 puncte
- Subtask 4: 6 puncte
La subtask-ul 5, veți fi punctați în funcție de acuratețe (notată mai jos acc) după cum urmează:
- acc < 0.4 => 0 puncte
- 0.4 <= acc < 0.5 => 10 puncte
- 0.5 <= acc < 0.6 => 25 puncte
- 0.6 <= acc < 0.7 => 55 puncte
- 0.7 <= acc < 0.75 => 65 puncte
- 0.75 <= acc => 80 puncte
Editorial
https://github.com/Olimpiada-AI/Editoriale/tree/main/SimulareOJIA-1-2025/CreditScore
Submission
My submissions
Only submissions marked as final are counted for the complete leaderboard. Not choosing any final submissions will result in 0 points on this task.
Complete submission scores will be displayed after the competition ends
Credit Score
Prezentare generală
Setul de date utilizat pentru această provocare provine de la o bancă și conține informații despre utilizatori, având ca scop prezicerea dacă un utilizator este un bun platnic. Problema este una de clasificare cu 3 posible etichete asociate unui client: POOR CREDIT SCORE
, codificat prin valoarea -1, STANDARD CREDIT SCORE
, codificat prin valoarea 0 și GOOD CREDIT SCORE
, codificat prin valoarea 1.
Prezentarea setului de date
Setul de date din fișierul train_data.csv
conține următoarele coloane:
- ID: cod de identificare unic în hexazecimal a fiecărei linii
- Customer_ID: cod de identificare unic al clientului
- Month: luna din an
- Name: numele clientului
- Age: vârsta clientului exprimată în ani
- SSN: cod numeric personal al clientului
- Occupation: ocupația clientului
- Annual_Income: venitul anul al clientului
- Monthly_Inhand_Salary: salariul lunar net al clientului
- Num_Bank_Accounts: numărul de conturi bancare ale clientului
- Num_Credit_Card: numărul de carduri de credit pe care le deține clientul
- Interest_Rate: dobânda
- Num_of_Loan: numărul de împrumuturi ale clientului
- Type_of_Loan: o listă care conține tipurile acestor împrumuturi
- Delay_from_due_date: întârzierea față de data scadentă
- Num_of_Delayed_Payment: numărul de plați efectuate cu întârziere
- Changed_Credit_Limit
- Num_Credit_Inquiries
- Credit_Mix
- Outstanding_Debt
- Credit_Utilization_Ratio
- Credit_History_Age
- Payment_of_Min_Amount
- Total_EMI_per_month
- Amount_invested_monthly
- Payment_Behaviour
- Monthly_Balance
- Credit_Score: una dintre cele 3 etichete posibile asociate unui client
Setul de date din fișierul test_data.csv
va conține aceleași coloane fără coloana Credit_Score
.
Cerință
Subtask 1:
Câte linii de intrare sunt in fișierul train_data.csv
?
Subtask 2:
Bazat pe datele fișierul train_data.csv
, care este media pentru "Salariul în mână" (Monthly_Inhand_Salary
) al clienților care au un Credit_Utilization_Ratio
mai mare sau egal cu 25? Afișați partea întreagă inferioară a acestei medii.
Subtask 3:
Bazat pe datele fișierul train_data.csv
, câte valori unice sunt înregistrate pentru atributul Month
?
Subtask 4:
Bazat pe datele fișierul train_data.csv
, câte valori unice ale atributului SSN
care se termină în 20
există?
Subtask 5:
Construiește un model de învățare automată pentru a prezice scorul de credit pentru fiecare înregistrare din setul de date de test (test_data.csv
).
Format de ieșire
Fișierul de ieșire încărcat de tip .csv
trebuie să conțină 3 coloane:
subtaskID
- reprezintă numărul subtaskului (1, 2, 3, 4 sau 5)datapointID
- care se referă la coloanaid
dintest_data.csv
answer
- răspunsul corespunzător datapointului pentru subtaskul respectiv
Notă: Pentru subtask-urile 1-4, la care se cere un singur răspuns pentru tot setul de date, afișați o singură linie a cărei datapointID
să fie 1. Pentru subtask-ul 5, răspunsurile trebuie să fie valori din mulțimea { -1, 0, 1 } corespunzătoare etichetei atribuite clientului.
Trimiteți un singur csv care să conțină răspunsurile pentru toate subtask-urile pe care le-ați rezolvat. Pentru a vedea un exemplu, descărcați fișierul sample_output.csv
Scor
- Subtask 1: 4 puncte
- Subtask 2: 5 puncte
- Subtask 3: 5 puncte
- Subtask 4: 6 puncte
La subtask-ul 5, veți fi punctați în funcție de acuratețe (notată mai jos acc) după cum urmează:
- acc < 0.4 => 0 puncte
- 0.4 <= acc < 0.5 => 10 puncte
- 0.5 <= acc < 0.6 => 25 puncte
- 0.6 <= acc < 0.7 => 55 puncte
- 0.7 <= acc < 0.75 => 65 puncte
- 0.75 <= acc => 80 puncte
Editorial
https://github.com/Olimpiada-AI/Editoriale/tree/main/SimulareOJIA-1-2025/CreditScore
Submission
My submissions
Only submissions marked as final are counted for the complete leaderboard. Not choosing any final submissions will result in 0 points on this task.
Complete submission scores will be displayed after the competition ends
Credit Score
Prezentare generală
Setul de date utilizat pentru această provocare provine de la o bancă și conține informații despre utilizatori, având ca scop prezicerea dacă un utilizator este un bun platnic. Problema este una de clasificare cu 3 posible etichete asociate unui client: POOR CREDIT SCORE
, codificat prin valoarea -1, STANDARD CREDIT SCORE
, codificat prin valoarea 0 și GOOD CREDIT SCORE
, codificat prin valoarea 1.
Prezentarea setului de date
Setul de date din fișierul train_data.csv
conține următoarele coloane:
- ID: cod de identificare unic în hexazecimal a fiecărei linii
- Customer_ID: cod de identificare unic al clientului
- Month: luna din an
- Name: numele clientului
- Age: vârsta clientului exprimată în ani
- SSN: cod numeric personal al clientului
- Occupation: ocupația clientului
- Annual_Income: venitul anul al clientului
- Monthly_Inhand_Salary: salariul lunar net al clientului
- Num_Bank_Accounts: numărul de conturi bancare ale clientului
- Num_Credit_Card: numărul de carduri de credit pe care le deține clientul
- Interest_Rate: dobânda
- Num_of_Loan: numărul de împrumuturi ale clientului
- Type_of_Loan: o listă care conține tipurile acestor împrumuturi
- Delay_from_due_date: întârzierea față de data scadentă
- Num_of_Delayed_Payment: numărul de plați efectuate cu întârziere
- Changed_Credit_Limit
- Num_Credit_Inquiries
- Credit_Mix
- Outstanding_Debt
- Credit_Utilization_Ratio
- Credit_History_Age
- Payment_of_Min_Amount
- Total_EMI_per_month
- Amount_invested_monthly
- Payment_Behaviour
- Monthly_Balance
- Credit_Score: una dintre cele 3 etichete posibile asociate unui client
Setul de date din fișierul test_data.csv
va conține aceleași coloane fără coloana Credit_Score
.
Cerință
Subtask 1:
Câte linii de intrare sunt in fișierul train_data.csv
?
Subtask 2:
Bazat pe datele fișierul train_data.csv
, care este media pentru "Salariul în mână" (Monthly_Inhand_Salary
) al clienților care au un Credit_Utilization_Ratio
mai mare sau egal cu 25? Afișați partea întreagă inferioară a acestei medii.
Subtask 3:
Bazat pe datele fișierul train_data.csv
, câte valori unice sunt înregistrate pentru atributul Month
?
Subtask 4:
Bazat pe datele fișierul train_data.csv
, câte valori unice ale atributului SSN
care se termină în 20
există?
Subtask 5:
Construiește un model de învățare automată pentru a prezice scorul de credit pentru fiecare înregistrare din setul de date de test (test_data.csv
).
Format de ieșire
Fișierul de ieșire încărcat de tip .csv
trebuie să conțină 3 coloane:
subtaskID
- reprezintă numărul subtaskului (1, 2, 3, 4 sau 5)datapointID
- care se referă la coloanaid
dintest_data.csv
answer
- răspunsul corespunzător datapointului pentru subtaskul respectiv
Notă: Pentru subtask-urile 1-4, la care se cere un singur răspuns pentru tot setul de date, afișați o singură linie a cărei datapointID
să fie 1. Pentru subtask-ul 5, răspunsurile trebuie să fie valori din mulțimea { -1, 0, 1 } corespunzătoare etichetei atribuite clientului.
Trimiteți un singur csv care să conțină răspunsurile pentru toate subtask-urile pe care le-ați rezolvat. Pentru a vedea un exemplu, descărcați fișierul sample_output.csv
Scor
- Subtask 1: 4 puncte
- Subtask 2: 5 puncte
- Subtask 3: 5 puncte
- Subtask 4: 6 puncte
La subtask-ul 5, veți fi punctați în funcție de acuratețe (notată mai jos acc) după cum urmează:
- acc < 0.4 => 0 puncte
- 0.4 <= acc < 0.5 => 10 puncte
- 0.5 <= acc < 0.6 => 25 puncte
- 0.6 <= acc < 0.7 => 55 puncte
- 0.7 <= acc < 0.75 => 65 puncte
- 0.75 <= acc => 80 puncte
Editorial
https://github.com/Olimpiada-AI/Editoriale/tree/main/SimulareOJIA-1-2025/CreditScore
Submission
My submissions
Only submissions marked as final are counted for the complete leaderboard. Not choosing any final submissions will result in 0 points on this task.
Complete submission scores will be displayed after the competition ends