logo
ALPHA
Competitions
thumbnail

Simulare OJIA 1

High-school
Romania
Individual

RO: Prima simulare a Olimpiadei Județene de Inteligență Artificială / EN: The first official simulation for the Romanian Regional Olympiad in Artificial Intelligence

Problems Communication Leaderboard Rules
Livrare pacheteCredit Score

Credit Score

Prezentare generală

Setul de date utilizat pentru această provocare provine de la o bancă și conține informații despre utilizatori, având ca scop prezicerea dacă un utilizator este un bun platnic. Problema este una de clasificare cu 3 posible etichete asociate unui client: POOR CREDIT SCORE, codificat prin valoarea -1, STANDARD CREDIT SCORE, codificat prin valoarea 0 și GOOD CREDIT SCORE, codificat prin valoarea 1.

Prezentarea setului de date

Setul de date din fișierul train_data.csv conține următoarele coloane:

  • ID: cod de identificare unic în hexazecimal a fiecărei linii
  • Customer_ID: cod de identificare unic al clientului
  • Month: luna din an
  • Name: numele clientului
  • Age: vârsta clientului exprimată în ani
  • SSN: cod numeric personal al clientului
  • Occupation: ocupația clientului
  • Annual_Income: venitul anul al clientului
  • Monthly_Inhand_Salary: salariul lunar net al clientului
  • Num_Bank_Accounts: numărul de conturi bancare ale clientului
  • Num_Credit_Card: numărul de carduri de credit pe care le deține clientul
  • Interest_Rate: dobânda
  • Num_of_Loan: numărul de împrumuturi ale clientului
  • Type_of_Loan: o listă care conține tipurile acestor împrumuturi
  • Delay_from_due_date: întârzierea față de data scadentă
  • Num_of_Delayed_Payment: numărul de plați efectuate cu întârziere
  • Changed_Credit_Limit
  • Num_Credit_Inquiries
  • Credit_Mix
  • Outstanding_Debt
  • Credit_Utilization_Ratio
  • Credit_History_Age
  • Payment_of_Min_Amount
  • Total_EMI_per_month
  • Amount_invested_monthly
  • Payment_Behaviour
  • Monthly_Balance
  • Credit_Score: una dintre cele 3 etichete posibile asociate unui client

Setul de date din fișierul test_data.csv va conține aceleași coloane fără coloana Credit_Score.

Cerință

Subtask 1:

Câte linii de intrare sunt in fișierul train_data.csv?

Subtask 2:

Bazat pe datele fișierul train_data.csv , care este media pentru "Salariul în mână" (Monthly_Inhand_Salary) al clienților care au un Credit_Utilization_Ratio mai mare sau egal cu 25? Afișați partea întreagă inferioară a acestei medii.

Subtask 3:

Bazat pe datele fișierul train_data.csv , câte valori unice sunt înregistrate pentru atributul Month?

Subtask 4:

Bazat pe datele fișierul train_data.csv , câte valori unice ale atributului SSN care se termină în 20 există?

Subtask 5:

Construiește un model de învățare automată pentru a prezice scorul de credit pentru fiecare înregistrare din setul de date de test (test_data.csv).

Format de ieșire

Fișierul de ieșire încărcat de tip .csv trebuie să conțină 3 coloane:

  • subtaskID - reprezintă numărul subtaskului (1, 2, 3, 4 sau 5)
  • datapointID - care se referă la coloana id din test_data.csv
  • answer - răspunsul corespunzător datapointului pentru subtaskul respectiv

Notă: Pentru subtask-urile 1-4, la care se cere un singur răspuns pentru tot setul de date, afișați o singură linie a cărei datapointID să fie 1. Pentru subtask-ul 5, răspunsurile trebuie să fie valori din mulțimea { -1, 0, 1 } corespunzătoare etichetei atribuite clientului.

Trimiteți un singur csv care să conțină răspunsurile pentru toate subtask-urile pe care le-ați rezolvat. Pentru a vedea un exemplu, descărcați fișierul sample_output.csv

Scor

  • Subtask 1: 4 puncte
  • Subtask 2: 5 puncte
  • Subtask 3: 5 puncte
  • Subtask 4: 6 puncte

La subtask-ul 5, veți fi punctați în funcție de acuratețe (notată mai jos acc) după cum urmează:

  • acc < 0.4 => 0 puncte
  • 0.4 <= acc < 0.5 => 10 puncte
  • 0.5 <= acc < 0.6 => 25 puncte
  • 0.6 <= acc < 0.7 => 55 puncte
  • 0.7 <= acc < 0.75 => 65 puncte
  • 0.75 <= acc => 80 puncte

Editorial

https://github.com/Olimpiada-AI/Editoriale/tree/main/SimulareOJIA-1-2025/CreditScore

Submission

Make sure your source code produces the output you uploaded! Chosen submissions may be rerun with your source code after the competition to get the final score.

My submissions

Only submissions marked as final are counted for the complete leaderboard. Not choosing any final submissions will result in 0 points on this task.

Complete submission scores will be displayed after the competition ends