logo
ALPHA
Competitions
thumbnail

Nitro AI Warmup Round

High-school
Romania
Individual

For our launch you will have to solve 2 problems: get the best score in the competition and be the first one to report a bug in our Bug Bounty program.

Problems Communication Leaderboard Rules
Steam Predict
TaskEditorial

Steam Predict

Enunț

Implementați un model de AI pentru a prezice prețurile din jocurile de pe Steam având la dispoziție un set de antrenare train_data.csv și unul pe care trebuie să faceți doar predicția test_data.csv.

Setul de date conține următoarele câmpuri având semnificațiile:

  • Name: nume aplicație
  • AppID: identificatorul jocului
  • Metacritic score: nota medie a jocului de pe platforma de recenzii Metacritic
  • Genres: o lista separata prin virgule conținând tag-uri referitoare la tipul de joc
  • Publishers: numele producătorilor
  • Estimated Owners: de forma min – max, însemnând așteptările (producătorilor jocului) minime și maxime de jocuri vândute
  • Negatives: numărul de dislike-uri
  • Positives: numărul de like-uri
  • Recommendations: câte persoane recomandă acest joc

Note despre setul de date:

  • Câmpul-țintă este „Price”. Date fiind celelalte feature-uri, scopul este de a prezice „Price”. Setul de date de evaluare vizibil pentru candidați nu conține acest câmp. Metrica de evaluare folosita este F1
  • Câmpul Genres, fiind o listă, trebuie transformat în date numerice într-un fel sau altul pentru a putea fi folosit in algoritmii de ML.
  • Asemănător pentru câmpul Estimated Owners
  • Unele câmpuri pot fi inutile in predicția câmpului-țintă. Încercați să analizați datele și să selectați doar ce este nevoie sau ar putea explica predicția.

Cerințe

Subtask 1 (20p). "Avg owners": pentru fiecare camp din coloana "Estimated Owners" de forma min – max, extrageți media valorilor considerând pentru fiecare linie int ((min + max) / 2).

Subtask 2(80p) "Price": Implementați un model de AI și rulați predicția pentru fiecare rând din test_data.csv.

Format de ieșire

Fișierul de ieșire încărcat de tip .csv trebuie să conțină 3 coloane:

  • subtaskID - reprezintă numărul subtaskului (1 sau 2)
  • datapointID - care se referă la coloana id din test_data.csv
  • answer - răspunsul corespunzător datapointului pentru subtaskul respectiv

Trimiteți un singur csv care să conțină răspunsurile pentru toate subtask-urile pe care le-ați rezolvat. Pentru a vedea un exemplu, descărcați fișierul sample_output.csv

Editorial și datele problemei

https://github.com/Olimpiada-AI/Propunere-probleme-si-solutii

Files

Train DataTest DataSample OutputStarter Kit

Submission

Make sure your source code produces the output you uploaded! Chosen submissions may be rerun with your source code after the competition to get the final score.

My submissions

Only submissions marked as final are counted for the complete leaderboard. Not choosing any final submissions will result in 0 points on this task.

Complete submission scores will be displayed after the competition ends