Simulare OJIA 2
RO: A doua simulare a Olimpiadei Județene de Inteligență Artificială / EN: The second official simulation for the Romanian Regional Olympiad in Artificial Intelligence
Predicția prețului unei case
Pentru această problemă trebuie să implementați un model de regresie capabil să prezică valoarea prețului unei case (Price
) utilizând un set de date disponibil. Setul de date este organizat într-un fișier CSV, iar performanța modelului se va evalua pe baza erorii medii absolute (MAE).
Setul de date conține următoarele coloane:
- Square_Footage: Suprafața casei
- Num_Bedrooms: Numărul de dormitoare
- Num_Bathrooms: Numărul de băi
- Year_Built: Anul în care a fost construită casa
- Lot_Size: Dimensiunea terenului
- Garage_Size: Dimensiunea garajului
- Neighborhood_Quality: Calitatea vecinătății
- Footage_to_Lot_Ratio: Raportul dintre suprafața casei și dimensiunea terenului
- Total_Rooms: Numărul total de camere
- Age_of_House: Vârsta casei
- Garage_to_Footage_Ratio: Raportul dintre dimensiunea garajului și suprafața casei
- Avg_Room_Size: Dimensiunea medie a camerelor
- Price: Variabila țintă, prețul casei (valoare numerică, obiectivul predicției)
- House_Orientation_Angle: Unghiul de orientare al casei
- Street_Alignment_Offset: Alinierea străzii
- Solar_Exposure_Index: Indexul de expunere solară
- Magnetic_Field_Strength: Intensitatea câmpului magnetic
- Vibration_Level: Nivelul vibrațiilor
Task-uri
Subtask 1 (10 puncte)
Pentru fiecare locuință din setul de testare, determinați suprafața totală estimată ca suma dintre suprafața casei (Square_Footage
), dimensiunea garajului (Garage_Size
) și dimensiunea terenului (Lot_Size
).
Subtask 2 (10 puncte)
Pentru fiecare locuință din setul de testare, calculați raportul dintre dimensiunea garajului (Garage_Size
) și numărul total de camere (Total_Rooms
). Rezultatul va fi adăugat ca o nouă coloană numită Garage_to_Room_Ratio
.
Subtask 3 (10 puncte)
Pentru fiecare locuință din setul de testare, calculați indicele de stabilitate a mediului, definit ca diferența dintre indexul de expunere solară (Solar_Exposure_Index
) și nivelul vibrațiilor (Vibration_Level
), împărțită la intensitatea câmpului magnetic (Magnetic_Field_Strength
).
Env_Stability_Index= (Solar_Exposure_Index - Vibration_Level) / Magnetic_Field_Strength
Subtask 4 (10 puncte)
Pornind de la setul de date pentru antrenare, calculați media valorilor din coloana Square_Footage
, reprezentând suprafața medie a caselor din setul de antrenare.
Ulterior, pentru fiecare locuință din setul de testare, determinați modulul diferenței dintre suprafața efectivă a casei (Square_Footage
) și media calculată pe setul de antrenare.
Subtask 5 (60 puncte)
Scopul principal al acestui task este de a construi un model de învățare automată care să prezică Price
pe baza caracteristicilor furnizate în setul de date. Modelul trebuie să fie capabil să generalizeze bine pe date noi și este evaluat utilizând Mean Absolute Error (MAE).
Implementați un model de regresie pentru predicția câmpului Price
, utilizând setul de antrenament dataset_train.csv
.
Determinați predicțiile pe setul de evaluare ce este furnizat în fișierul CSV dataset_eval.csv
(acesta nu conține coloana Price
).
Note despre setul de date:
- Câmpul-țintă este
Price
, o valoare numerică ce reprezintă prețul casei. - Variabilele numerice (
Square_Footage
,Num_Bedrooms
,Num_Bathrooms
,Year_Built
,Lot_Size
,Garage_Size
,Footage_to_Lot_Ratio
,Total_Rooms
,Age_of_House
,Garage_to_Footage_Ratio
,Avg_Room_Size
,House_Orientation_Angle
,Street_Alignment_Offset
,Solar_Exposure_Index
,Magnetic_Field_Strength
,Vibration_Level
) pot fi utilizate direct pentru regresie. - Se recomandă verificarea și tratarea valorilor lipsă (dacă există) și normalizarea/scalarea caracteristicilor pentru a îmbunătăți performanța modelului.
Criterii de evaluare:
- Performanță: Modelul trebuie să aibă o MAE cât mai mică.
Notă
Dacă veți trimite sample_output, atunci veți primi 5 puncte.
Submission
My submissions
Only submissions marked as final are counted for the complete leaderboard. Not choosing any final submissions will result in 0 points on this task.
Complete submission scores will be displayed after the competition ends
Predicția prețului unei case
Pentru această problemă trebuie să implementați un model de regresie capabil să prezică valoarea prețului unei case (Price
) utilizând un set de date disponibil. Setul de date este organizat într-un fișier CSV, iar performanța modelului se va evalua pe baza erorii medii absolute (MAE).
Setul de date conține următoarele coloane:
- Square_Footage: Suprafața casei
- Num_Bedrooms: Numărul de dormitoare
- Num_Bathrooms: Numărul de băi
- Year_Built: Anul în care a fost construită casa
- Lot_Size: Dimensiunea terenului
- Garage_Size: Dimensiunea garajului
- Neighborhood_Quality: Calitatea vecinătății
- Footage_to_Lot_Ratio: Raportul dintre suprafața casei și dimensiunea terenului
- Total_Rooms: Numărul total de camere
- Age_of_House: Vârsta casei
- Garage_to_Footage_Ratio: Raportul dintre dimensiunea garajului și suprafața casei
- Avg_Room_Size: Dimensiunea medie a camerelor
- Price: Variabila țintă, prețul casei (valoare numerică, obiectivul predicției)
- House_Orientation_Angle: Unghiul de orientare al casei
- Street_Alignment_Offset: Alinierea străzii
- Solar_Exposure_Index: Indexul de expunere solară
- Magnetic_Field_Strength: Intensitatea câmpului magnetic
- Vibration_Level: Nivelul vibrațiilor
Task-uri
Subtask 1 (10 puncte)
Pentru fiecare locuință din setul de testare, determinați suprafața totală estimată ca suma dintre suprafața casei (Square_Footage
), dimensiunea garajului (Garage_Size
) și dimensiunea terenului (Lot_Size
).
Subtask 2 (10 puncte)
Pentru fiecare locuință din setul de testare, calculați raportul dintre dimensiunea garajului (Garage_Size
) și numărul total de camere (Total_Rooms
). Rezultatul va fi adăugat ca o nouă coloană numită Garage_to_Room_Ratio
.
Subtask 3 (10 puncte)
Pentru fiecare locuință din setul de testare, calculați indicele de stabilitate a mediului, definit ca diferența dintre indexul de expunere solară (Solar_Exposure_Index
) și nivelul vibrațiilor (Vibration_Level
), împărțită la intensitatea câmpului magnetic (Magnetic_Field_Strength
).
Env_Stability_Index= (Solar_Exposure_Index - Vibration_Level) / Magnetic_Field_Strength
Subtask 4 (10 puncte)
Pornind de la setul de date pentru antrenare, calculați media valorilor din coloana Square_Footage
, reprezentând suprafața medie a caselor din setul de antrenare.
Ulterior, pentru fiecare locuință din setul de testare, determinați modulul diferenței dintre suprafața efectivă a casei (Square_Footage
) și media calculată pe setul de antrenare.
Subtask 5 (60 puncte)
Scopul principal al acestui task este de a construi un model de învățare automată care să prezică Price
pe baza caracteristicilor furnizate în setul de date. Modelul trebuie să fie capabil să generalizeze bine pe date noi și este evaluat utilizând Mean Absolute Error (MAE).
Implementați un model de regresie pentru predicția câmpului Price
, utilizând setul de antrenament dataset_train.csv
.
Determinați predicțiile pe setul de evaluare ce este furnizat în fișierul CSV dataset_eval.csv
(acesta nu conține coloana Price
).
Note despre setul de date:
- Câmpul-țintă este
Price
, o valoare numerică ce reprezintă prețul casei. - Variabilele numerice (
Square_Footage
,Num_Bedrooms
,Num_Bathrooms
,Year_Built
,Lot_Size
,Garage_Size
,Footage_to_Lot_Ratio
,Total_Rooms
,Age_of_House
,Garage_to_Footage_Ratio
,Avg_Room_Size
,House_Orientation_Angle
,Street_Alignment_Offset
,Solar_Exposure_Index
,Magnetic_Field_Strength
,Vibration_Level
) pot fi utilizate direct pentru regresie. - Se recomandă verificarea și tratarea valorilor lipsă (dacă există) și normalizarea/scalarea caracteristicilor pentru a îmbunătăți performanța modelului.
Criterii de evaluare:
- Performanță: Modelul trebuie să aibă o MAE cât mai mică.
Notă
Dacă veți trimite sample_output, atunci veți primi 5 puncte.
Submission
My submissions
Only submissions marked as final are counted for the complete leaderboard. Not choosing any final submissions will result in 0 points on this task.
Complete submission scores will be displayed after the competition ends
Predicția prețului unei case
Pentru această problemă trebuie să implementați un model de regresie capabil să prezică valoarea prețului unei case (Price
) utilizând un set de date disponibil. Setul de date este organizat într-un fișier CSV, iar performanța modelului se va evalua pe baza erorii medii absolute (MAE).
Setul de date conține următoarele coloane:
- Square_Footage: Suprafața casei
- Num_Bedrooms: Numărul de dormitoare
- Num_Bathrooms: Numărul de băi
- Year_Built: Anul în care a fost construită casa
- Lot_Size: Dimensiunea terenului
- Garage_Size: Dimensiunea garajului
- Neighborhood_Quality: Calitatea vecinătății
- Footage_to_Lot_Ratio: Raportul dintre suprafața casei și dimensiunea terenului
- Total_Rooms: Num ărul total de camere
- Age_of_House: Vârsta casei
- Garage_to_Footage_Ratio: Raportul dintre dimensiunea garajului și suprafața casei
- Avg_Room_Size: Dimensiunea medie a camerelor
- Price: Variabila țintă, prețul casei (valoare numerică, obiectivul predicției)
- House_Orientation_Angle: Unghiul de orientare al casei
- Street_Alignment_Offset: Alinierea străzii
- Solar_Exposure_Index: Indexul de expunere solară
- Magnetic_Field_Strength: Intensitatea câmpului magnetic
- Vibration_Level: Nivelul vibrațiilor
Task-uri
Subtask 1 (10 puncte)
Pentru fiecare locuință din setul de testare, determinați suprafața totală estimată ca suma dintre suprafața casei (Square_Footage
), dimensiunea garajului (Garage_Size
) și dimensiunea terenului (Lot_Size
).
Subtask 2 (10 puncte)
Pentru fiecare locuință din setul de testare, calculați raportul dintre dimensiunea garajului (Garage_Size
) și numărul total de camere (Total_Rooms
). Rezultatul va fi adăugat ca o nouă coloană numită Garage_to_Room_Ratio
.
Subtask 3 (10 puncte)
Pentru fiecare locuință din setul de testare, calculați indicele de stabilitate a mediului, definit ca diferența dintre indexul de expunere solară (Solar_Exposure_Index
) și nivelul vibrațiilor (Vibration_Level
), împărțită la intensitatea câmpului magnetic (Magnetic_Field_Strength
).
Env_Stability_Index= (Solar_Exposure_Index - Vibration_Level) / Magnetic_Field_Strength
Subtask 4 (10 puncte)
Pornind de la setul de date pentru antrenare, calculați media valorilor din coloana Square_Footage
, reprezentând suprafața medie a caselor din setul de antrenare.
Ulterior, pentru fiecare locuință din setul de testare, determinați modulul diferenței dintre suprafața efectivă a casei (Square_Footage
) și media calculată pe setul de antrenare.
Subtask 5 (60 puncte)
Scopul principal al acestui task este de a construi un model de învățare automată care să prezică Price
pe baza caracteristicilor furnizate în setul de date. Modelul trebuie să fie capabil să generalizeze bine pe date noi și este evaluat utilizând Mean Absolute Error (MAE).
Implementați un model de regresie pentru predicția câmpului Price
, utilizând setul de antrenament dataset_train.csv
.
Determinați predicțiile pe setul de evaluare ce este furnizat în fișierul CSV dataset_eval.csv
(acesta nu conține coloana Price
).
Note despre setul de date:
- Câmpul-țintă este
Price
, o valoare numerică ce reprezintă prețul casei. - Variabilele numerice (
Square_Footage
,Num_Bedrooms
,Num_Bathrooms
,Year_Built
,Lot_Size
,Garage_Size
,Footage_to_Lot_Ratio
,Total_Rooms
,Age_of_House
,Garage_to_Footage_Ratio
,Avg_Room_Size
,House_Orientation_Angle
,Street_Alignment_Offset
,Solar_Exposure_Index
,Magnetic_Field_Strength
,Vibration_Level
) pot fi utilizate direct pentru regresie. - Se recomandă verificarea și tratarea valorilor lipsă (dacă există) și normalizarea/scalarea caracteristicilor pentru a îmbunătăți performanța modelului.
Criterii de evaluare:
- Performanță: Modelul trebuie să aibă o MAE cât mai mică.
Notă
Dacă veți trimite sample_output, atunci veți primi 5 puncte.
Submission
My submissions
Only submissions marked as final are counted for the complete leaderboard. Not choosing any final submissions will result in 0 points on this task.
Complete submission scores will be displayed after the competition ends
Predicția prețului unei case
Pentru această problemă trebuie să implementați un model de regresie capabil să prezică valoarea prețului unei case (Price
) utilizând un set de date disponibil. Setul de date este organizat într-un fișier CSV, iar performanța modelului se va evalua pe baza erorii medii absolute (MAE).
Setul de date conține următoarele coloane:
- Square_Footage: Suprafața casei
- Num_Bedrooms: Numărul de dormitoare
- Num_Bathrooms: Numărul de băi
- Year_Built: Anul în care a fost construită casa
- Lot_Size: Dimensiunea terenului
- Garage_Size: Dimensiunea garajului
- Neighborhood_Quality: Calitatea vecinătății
- Footage_to_Lot_Ratio: Raportul dintre suprafața casei și dimensiunea terenului
- Total_Rooms: Numărul total de camere
- Age_of_House: Vârsta casei
- Garage_to_Footage_Ratio: Raportul dintre dimensiunea garajului și suprafața casei
- Avg_Room_Size: Dimensiunea medie a camerelor
- Price: Variabila țintă, prețul casei (valoare numerică, obiectivul predicției)
- House_Orientation_Angle: Unghiul de orientare al casei
- Street_Alignment_Offset: Alinierea străzii
- Solar_Exposure_Index: Indexul de expunere solară
- Magnetic_Field_Strength: Intensitatea câmpului magnetic
- Vibration_Level: Nivelul vibrațiilor
Task-uri
Subtask 1 (10 puncte)
Pentru fiecare locuință din setul de testare, determinați suprafața totală estimată ca suma dintre suprafața casei (Square_Footage
), dimensiunea garajului (Garage_Size
) și dimensiunea terenului (Lot_Size
).
Subtask 2 (10 puncte)
Pentru fiecare locuință din setul de testare, calculați raportul dintre dimensiunea garajului (Garage_Size
) și numărul total de camere (Total_Rooms
). Rezultatul va fi adăugat ca o nouă coloană numită Garage_to_Room_Ratio
.
Subtask 3 (10 puncte)
Pentru fiecare locuință din setul de testare, calculați indicele de stabilitate a mediului, definit ca diferența dintre indexul de expunere solară (Solar_Exposure_Index
) și nivelul vibrațiilor (Vibration_Level
), împărțită la intensitatea câmpului magnetic (Magnetic_Field_Strength
).
Env_Stability_Index= (Solar_Exposure_Index - Vibration_Level) / Magnetic_Field_Strength
Subtask 4 (10 puncte)
Pornind de la setul de date pentru antrenare, calculați media valorilor din coloana Square_Footage
, reprezentând suprafața medie a caselor din setul de antrenare.
Ulterior, pentru fiecare locuință din setul de testare, determinați modulul diferenței dintre suprafața efectivă a casei (Square_Footage
) și media calculată pe setul de antrenare.
Subtask 5 (60 puncte)
Scopul principal al acestui task este de a construi un model de învățare automată care să prezică Price
pe baza caracteristicilor furnizate în setul de date. Modelul trebuie să fie capabil să generalizeze bine pe date noi și este evaluat utilizând Mean Absolute Error (MAE).
Implementați un model de regresie pentru predicția câmpului Price
, utilizând setul de antrenament dataset_train.csv
.
Determinați predicțiile pe setul de evaluare ce este furnizat în fișierul CSV dataset_eval.csv
(acesta nu conține coloana Price
).
Note despre setul de date:
- Câmpul-țintă este
Price
, o valoare numerică ce reprezintă prețul casei. - Variabilele numerice (
Square_Footage
,Num_Bedrooms
,Num_Bathrooms
,Year_Built
,Lot_Size
,Garage_Size
,Footage_to_Lot_Ratio
,Total_Rooms
,Age_of_House
,Garage_to_Footage_Ratio
,Avg_Room_Size
,House_Orientation_Angle
,Street_Alignment_Offset
,Solar_Exposure_Index
,Magnetic_Field_Strength
,Vibration_Level
) pot fi utilizate direct pentru regresie. - Se recomandă verificarea și tratarea valorilor lipsă (dacă există) și normalizarea/scalarea caracteristicilor pentru a îmbunătăți performanța modelului.
Criterii de evaluare:
- Performanță: Modelul trebuie să aibă o MAE cât mai mică.
Notă
Dacă veți trimite sample_output, atunci veți primi 5 puncte.
Submission
My submissions
Only submissions marked as final are counted for the complete leaderboard. Not choosing any final submissions will result in 0 points on this task.
Complete submission scores will be displayed after the competition ends