
Nitro AI Warmup Round
For our launch you will have to solve 2 problems: get the best score in the competition and be the first one to report a bug in our Bug Bounty program.
Steam Predict
Enunț
Implementați un model de AI pentru a prezice prețurile din jocurile de pe Steam având la dispoziție un set de antrenare train_data.csv
și unul pe care trebuie să faceți doar predicția test_data.csv
.
Setul de date conține următoarele câmpuri având semnificațiile:
Name
: nume aplicațieAppID
: identificatorul joculuiMetacritic score
: nota medie a jocului de pe platforma de recenzii MetacriticGenres
: o lista separata prin virgule conținând tag-uri referitoare la tipul de jocPublishers
: numele producătorilorEstimated Owners
: de forma min – max, însemnând așteptările (producătorilor jocului) minime și maxime de jocuri vânduteNegatives
: numărul de dislike-uriPositives
: numărul de like-uriRecommendations
: câte persoane recomandă acest joc
Note despre setul de date:
- Câmpul-țintă este „Price”. Date fiind celelalte feature-uri, scopul este de a prezice „Price”. Setul de date de evaluare vizibil pentru candidați nu conține acest câmp. Metrica de evaluare folosita este F1
- Câmpul Genres, fiind o listă, trebuie transformat în date numerice într-un fel sau altul pentru a putea fi folosit in algoritmii de ML.
- Asemănător pentru câmpul Estimated Owners
- Unele câmpuri pot fi inutile in predicția câmpului-țintă. Încercați să analizați datele și să selectați doar ce este nevoie sau ar putea explica predicția.
Cerințe
Subtask 1 (20p). "Avg owners": pentru fiecare camp din coloana "Estimated Owners" de forma min – max, extrageți media valorilor considerând pentru fiecare linie int ((min + max) / 2).
Subtask 2(80p)
"Price": Implementați un model de AI și rulați predicția pentru fiecare rând din test_data.csv
.
Format de ieșire
Fișierul de ieșire încărcat de tip .csv
trebuie să conțină 3 coloane:
subtaskID
- reprezintă numărul subtaskului (1 sau 2)datapointID
- care se referă la coloanaid
dintest_data.csv
answer
- răspunsul corespunzător datapointului pentru subtaskul respectiv
Trimiteți un singur csv care să conțină răspunsurile pentru toate subtask-urile pe care le-ați rezolvat. Pentru a vedea un exemplu, descărcați fișierul sample_output.csv
Editorial și datele problemei
https://github.com/Olimpiada-AI/Propunere-probleme-si-solutii
Submission
My submissions
Only submissions marked as final are counted for the complete leaderboard. Not choosing any final submissions will result in 0 points on this task.
Complete submission scores will be displayed after the competition ends
Steam Predict
Enunț
Implementați un model de AI pentru a prezice prețurile din jocurile de pe Steam având la dispoziție un set de antrenare train_data.csv
și unul pe care trebuie să faceți doar predicția test_data.csv
.
Setul de date conține următoarele câmpuri având semnificațiile:
Name
: nume aplicațieAppID
: identificatorul joculuiMetacritic score
: nota medie a jocului de pe platforma de recenzii MetacriticGenres
: o lista separata prin virgule conținând tag-uri referitoare la tipul de jocPublishers
: numele producătorilorEstimated Owners
: de forma min – max, însemnând așteptările (producătorilor jocului) minime și maxime de jocuri vânduteNegatives
: numărul de dislike-uriPositives
: numărul de like-uriRecommendations
: câte persoane recomandă acest joc
Note despre setul de date:
- Câmpul-țintă este „Price”. Date fiind celelalte feature-uri, scopul este de a prezice „Price”. Setul de date de evaluare vizibil pentru candidați nu conține acest câmp. Metrica de evaluare folosita este F1
- Câmpul Genres, fiind o listă, trebuie transformat în date numerice într-un fel sau altul pentru a putea fi folosit in algoritmii de ML.
- Asemănător pentru câmpul Estimated Owners
- Unele câmpuri pot fi inutile in predicția câmpului-țintă. Încercați să analizați datele și să selectați doar ce este nevoie sau ar putea explica predicția.
Cerințe
Subtask 1 (20p). "Avg owners": pentru fiecare camp din coloana "Estimated Owners" de forma min – max, extrageți media valorilor considerând pentru fiecare linie int ((min + max) / 2).
Subtask 2(80p)
"Price": Implementați un model de AI și rulați predicția pentru fiecare rând din test_data.csv
.
Format de ieșire
Fișierul de ieșire încărcat de tip .csv
trebuie să conțină 3 coloane:
subtaskID
- reprezintă numărul subtaskului (1 sau 2)datapointID
- care se referă la coloanaid
dintest_data.csv
answer
- răspunsul corespunzător datapointului pentru subtaskul respectiv
Trimiteți un singur csv care să conțină răspunsurile pentru toate subtask-urile pe care le-ați rezolvat. Pentru a vedea un exemplu, descărcați fișierul sample_output.csv
Editorial și datele problemei
https://github.com/Olimpiada-AI/Propunere-probleme-si-solutii
Submission
My submissions
Only submissions marked as final are counted for the complete leaderboard. Not choosing any final submissions will result in 0 points on this task.
Complete submission scores will be displayed after the competition ends