logo
ALPHA
Competitions
thumbnail

Simulare OJIA 2

High-school
Romania
Individual

RO: A doua simulare a Olimpiadei Județene de Inteligență Artificială / EN: The second official simulation for the Romanian Regional Olympiad in Artificial Intelligence

Problems Communication Leaderboard Rules
Predicția statusului pacientuluiPredicția prețului unei case

Predicția prețului unei case

Pentru această problemă trebuie să implementați un model de regresie capabil să prezică valoarea prețului unei case (Price) utilizând un set de date disponibil. Setul de date este organizat într-un fișier CSV, iar performanța modelului se va evalua pe baza erorii medii absolute (MAE).

Setul de date conține următoarele coloane:

  • Square_Footage: Suprafața casei
  • Num_Bedrooms: Numărul de dormitoare
  • Num_Bathrooms: Numărul de băi
  • Year_Built: Anul în care a fost construită casa
  • Lot_Size: Dimensiunea terenului
  • Garage_Size: Dimensiunea garajului
  • Neighborhood_Quality: Calitatea vecinătății
  • Footage_to_Lot_Ratio: Raportul dintre suprafața casei și dimensiunea terenului
  • Total_Rooms: Numărul total de camere
  • Age_of_House: Vârsta casei
  • Garage_to_Footage_Ratio: Raportul dintre dimensiunea garajului și suprafața casei
  • Avg_Room_Size: Dimensiunea medie a camerelor
  • Price: Variabila țintă, prețul casei (valoare numerică, obiectivul predicției)
  • House_Orientation_Angle: Unghiul de orientare al casei
  • Street_Alignment_Offset: Alinierea străzii
  • Solar_Exposure_Index: Indexul de expunere solară
  • Magnetic_Field_Strength: Intensitatea câmpului magnetic
  • Vibration_Level: Nivelul vibrațiilor

Task-uri

Subtask 1 (10 puncte)

Pentru fiecare locuință din setul de testare, determinați suprafața totală estimată ca suma dintre suprafața casei (Square_Footage), dimensiunea garajului (Garage_Size) și dimensiunea terenului (Lot_Size).

Subtask 2 (10 puncte)

Pentru fiecare locuință din setul de testare, calculați raportul dintre dimensiunea garajului (Garage_Size) și numărul total de camere (Total_Rooms). Rezultatul va fi adăugat ca o nouă coloană numită Garage_to_Room_Ratio.

Subtask 3 (10 puncte)

Pentru fiecare locuință din setul de testare, calculați indicele de stabilitate a mediului, definit ca diferența dintre indexul de expunere solară (Solar_Exposure_Index) și nivelul vibrațiilor (Vibration_Level), împărțită la intensitatea câmpului magnetic (Magnetic_Field_Strength).

Env_Stability_Index= (Solar_Exposure_Index - Vibration_Level) / Magnetic_Field_Strength​

Subtask 4 (10 puncte)

Pornind de la setul de date pentru antrenare, calculați media valorilor din coloana Square_Footage, reprezentând suprafața medie a caselor din setul de antrenare.

Ulterior, pentru fiecare locuință din setul de testare, determinați modulul diferenței dintre suprafața efectivă a casei (Square_Footage) și media calculată pe setul de antrenare.

Subtask 5 (60 puncte)

Scopul principal al acestui task este de a construi un model de învățare automată care să prezică Price pe baza caracteristicilor furnizate în setul de date. Modelul trebuie să fie capabil să generalizeze bine pe date noi și este evaluat utilizând Mean Absolute Error (MAE).

Implementați un model de regresie pentru predicția câmpului Price, utilizând setul de antrenament dataset_train.csv. Determinați predicțiile pe setul de evaluare ce este furnizat în fișierul CSV dataset_eval.csv (acesta nu conține coloana Price).

Note despre setul de date:

  • Câmpul-țintă este Price, o valoare numerică ce reprezintă prețul casei.
  • Variabilele numerice (Square_Footage, Num_Bedrooms, Num_Bathrooms, Year_Built, Lot_Size, Garage_Size, Footage_to_Lot_Ratio, Total_Rooms, Age_of_House, Garage_to_Footage_Ratio, Avg_Room_Size, House_Orientation_Angle, Street_Alignment_Offset, Solar_Exposure_Index, Magnetic_Field_Strength, Vibration_Level) pot fi utilizate direct pentru regresie.
  • Se recomandă verificarea și tratarea valorilor lipsă (dacă există) și normalizarea/scalarea caracteristicilor pentru a îmbunătăți performanța modelului.

Criterii de evaluare:

  • Performanță: Modelul trebuie să aibă o MAE cât mai mică.

Notă

Dacă veți trimite sample_output, atunci veți primi 5 puncte.

Submission

Make sure your source code produces the output you uploaded! Chosen submissions may be rerun with your source code after the competition to get the final score.

My submissions

Only submissions marked as final are counted for the complete leaderboard. Not choosing any final submissions will result in 0 points on this task.

Complete submission scores will be displayed after the competition ends