logo
ALPHA
Competitions
thumbnail

OJIA 9-10

High-school
Romania
Individual

RO: Etapa Judeteana pentru clasele a IX-a si a X-a a Olimpiadei de Inteligenta Artificiala / EN: Regional phase of the Romanian National Olympiad in Artificial Intelligence, for high school students in the 9th and 10th grades

Problems Communication Leaderboard Rules
🤾‍♂️ Consum Caloric🚚 SmartCargo - Optimizarea livrărilor în România
TaskEditorial

🤾‍♂️ Consum Caloric

Enunț

Implementați un model de AI/ML pentru a prezice consumul caloric al unei activități având la dispoziție un set de antrenare train_data.csv și setul de testare test_data.csv (pe care trebuie să realizați doar predicția).

Setul de date conține următoarele câmpuri având semnificațiile:

  • User_ID: ID-ul utilizatorului care a realizat activitatea
  • Gender: genul utilizatorului
  • Age: vârsta utilizatorului
  • Height: înălțimea utilizatorului în cm
  • Weight: greutatea utilizatorului în kg
  • Duration: durata activității
  • Heart_Rate: ritmul cardiac mediu pe parcursul activității
  • Body_Temp: temperatura medie pe parcursul activității
  • Calories: numărul de calorii consumate pe parcursul activității (prezent doar în setul de date de antrenare)

Note despre setul de date:

Atributul-țintă este Calories. Date fiind celelalte atribute, scopul este de a prezice Calories pe baza setului de date de testare. Metrica de evaluare folosită este MAE (media sumei diferențelor absolute dintre valoarea prezisă de către algoritm și valoarea corectă).

Cerințe

Partea 1 (20p). Bazat pe setul de date de antrenare calculați următoarele:

"Samples, No.Males, AverageDuration, SeniorUsers”

  • Subtask 1: Samples: numărul de linii din setul de date de antrenare
  • Subtask 2: No.Males: numărul de exemple de antrenament care descriu activități realizate de către bărbați
  • Subtask 3: AverageDuration: durata medie a activităților din setul de antrenare.
  • Subtask 4: SeniorUsers: numărul de utilizatori, din setul de antrenare, care au cel puțin 75 de ani împliniți

Fiecare din cele 4 subtask-uri valorează 5p.

Partea 2 (80p)

  • Subtask 5: (60p) Dezvoltați un model de AI/ML și efectuați predicția pentru atributul Calories pentru fiecare exemplu din fișierul cu datele de test, pentru care coloana Subtask are valoarea 5.

  • Subtask 6: (20p) O echipă de handbal masculin are nevoie să estimeze consumul caloric pentru a optimiza dieta jucătorilor. Dezvoltați un model de AI/ML și realizați predicția numărului de calorii pentru pentru fiecare exemplu din fișierul cu datele de test pentru care coloana Subtask are valoarea 6.

Format de ieșire

Un fișier csv output.csv care să includă următoarele 3 coloane:

  • subtaskID - reprezintă numărul subtaskului (1, 2, 3, 4, 5 sau 6)
  • datapointID - care se referă la coloana User_ID din test_data.csv
  • answer - răspunsul corespunzător datapoint-ului pentru subtaskul respectiv

Notă: Pentru subtask-urile 1, 2, 3 și 4, la care se cere un singur răspuns pentru tot setul de date, afișați o singură linie a cărei datapointID să fie 1.

Trimiteți un singur csv care să conțină răspunsurile pentru toate subtask-urile pe care le-ați rezolvat. Pentru a vedea un exemplu, descărcați fișierul sample_output.csv

Files

Train DataTest DataSample OutputStarter Kit

Submission

Make sure your source code produces the output you uploaded! Chosen submissions may be rerun with your source code after the competition to get the final score.

My submissions

Only submissions marked as final are counted for the complete leaderboard. Not choosing any final submissions will result in 0 points on this task.

Complete submission scores will be displayed after the competition ends