R Competition


Język polski 
Welcome to the R Competition (July 2016) website

R_competition_final2

On this page are details of the three phases of this competition, as well as prizes and deadlines.

UPDATE (12:00 CET 10 July 2016): As well as Poland, there are teams from Armenia, Canada, Columbia, France, India, Israel, Lebanon, Malaysia, Netherlands, Russia, Singapore, South Africa, Switzerland, USA and Venezuela.

The Competition will be in three parts:

 1. Gender bias in cognitive tasks – Details will appear on 8 July 2016
 2. Scoring maths tests using errors and time – Details will appear on 22 July 2016
 3. The socio-economic impact on literacy development – Details will appear on 5 August 2016

All documents will be released through GitHub.

Organiser: Do-IT Solutions Ltd and eRka

Sponsor: Do-IT Solutions Ltd

Patrons: INIME, FuRBS and SmarterPoland

Also thanks to R-Bloggers for their support

For further details contact Ian Smythe:

ISEmail

(in English or Polish)

Introduction

Following on from the very successful 2015 Krakow Data Hackathon, Do-IT Solutions has again joined forces with eRKa to develop an exciting R Competition to address questions that could change the lives of (choosing my words carefully) millions. We have put together three small competitions that use data never previously analysed, and mostly collected in 2016. Although these are all important, the questions chosed for the competition also had to fulfil three criteria.

 1. Be relevant to large numbers of individuals in the area where data was collected
 2. Address an issue that could has implications for other contexts (i.e. for other tests and other countries)
 3. Involve techniques and subjective decisions that would minimise the possibility of two identical solutions.

Knowing everybody has busy lives, summer holidays, and not all subjects may be of interest, we decided to provide three separate competitions, offering a small prize for each. To encourage individuals and teams to enter all three, we decided to offer an additional prize for those that had the best “combined” score. Judging of the overall winner will combine using scores from each of the three parts, plus decisions by the panel of judges. The key date for each competition is given below. For each competition there will be a data set (minimum of 1000 individuals) that has been “cleaned”, so people can immediately start analysing. There will also be a brief background description to help understand the subject matter, and a short reading list for those who wish to understand the subject in greater depth.

Registration

To submit your entry, you will need to register prior to the closing date. We strongly recommend that you do register, as that is the best way to ensure you have any updates or additional information.

The Registration page will be available from 1 July 2016.

Details

In order to try to not give anybody a significant advantage (e.g. you may have missed the first two but want to participate in the third) we shall have key dates for each competition, when the information will become available through this site.

We have developed on online “data exploration” Shiny app which will be made available to start to explore the data. This will become available once data has been released. This will minimise the time needed to get to know the data, allowing the main focus to be on the creative exploration.

Gender bias in cognitive tasks

Competition 1 – Submission details
After considering the option, Dropbox – Submit Files services is the preferred option. It is free and open to all (i.e. you do not need a Dropbox account), and does not permit others to see your results.

Competition 1 – File Naming
Please ensure the name of each file starts with the team name (where appropriate) followed by your name. Submit all files that are needed to evaluate the results, including the data file if your script uses a modified version of the data file provided. Note that in the event of a draw, the accompanying details (e.g. annotations in scripts and documentation that explains the approach) may be taken into consideration by the judges.

Scoring maths tests using errors and time

The impact of socio-economics and disability on literacy development

Formats and Submitting entries

The only accepted programming language is R. Code will need to be submitted for verification purposes. Where the dataset (csv) has been modified, the dataset should also be provided.

Question that arise may be written in English or Polish.

Prizes

The First Prize is a certification. However, there will also be a cash prize of PLN500 per competition that will be presented to team that has the “best answers” which attends the “Awards Ceremony” in a pub somewhere in Krakow. In addition there will be t-shirts and other small prizes. The Overall Prize is also PLN500.

It is hoped that following the competition, there will be opportunities to publish in academic journals.

Footnote

There is a lot more data and a lot more questions to be answered. If any tutor or lecturer that teachers R wishes a data set for the students to learn or practice coding, cleaned or uncleaned, please contact me for more information.R Konkurs

Witamy na stronie internetowej R KONKURSU (lipiec 2016)

Na tej stronie znajdziesz szczegóły dotyczące trzech faz konkursu, nagród oraz terminów.

Konkurs odbędzie się w trzech niezależnych etapach:

 1. Różnice płci w zadaniach poznawczych. – szczegóły pojawią się 8 Lipca 2016
 2. Przewidywanie wyniku testów matematycznych na podstawie błędów i czasu odpowiedzi. – szczegóły pojawią się 22 Lipca 2016
 3. Wpływ czynników socjo-ekonomicznych na rozwój umiejętności czytania i pisania. – szczegóły pojawią się 6 Sierpnia 2016

Wszystkie dane zostaną udostępnione poprzez GitHub.

Organizatorzy:  Do-IT Solutions Ltd i eRka

Sponsor:  Do-IT Solutions Ltd

Patroni:  INIME, FuRBS i SmarterPoland

W razie dodatkowych pytań, proszę kontaktować się z Ianem Smythem:

ISEmail

(w języku polskim lub angielskim)

Wprowadzenie

Zapraszamy do wzięcia udziału w wakacyjnym konkursie R w stylu Kaggle. Jest to drużynowy konkurs online o zasięgu ogólnopolskim, który odbędzie się w miesiącach lipiec-sierpień 2016. Wydarzenie jest kontynuacją udanego maratonu analizy danych, który odbył się w lipcu 2015 roku w Krakowie. Do It Solutions Ltd oraz eRka postanowili znowu połączyć siły i zorganizować ekscytujący konkurs, aby móc odpowiedzieć na pytania, które mogą zmienić życie milionów (oczywiście trzeba traktować te słowa bardzo ostrożnie).

Z uwagi na to, że jest to okres wakacyjny i dostępność niektórych osób może być różna, postanowiliśmy podzielić zawody na trzy etapy (nagradzanymi osobno). Każdy z etapów będzie wymagał przeanalizowania nigdy wcześniej niepublikowanych danych (większość z tych danych została zebrana w tym roku).  Poprzez Shiny opracowaliśmy aplikację, która pozwoli na analizę udostępnionych danych on-line. Narzędzie ma pozwolić uczestnikom zminimalizować czas na zapoznanie się z danymi, dzięki czemu będzie można skupić się na twórczej ich eksploracji.  Dostęp do aplikacji zostanie przekazany w momencie przesłania danych do uczestników konkursu.

Dodatkowo podczas każdego z etapów będą brane pod uwagę następujące kryteria:

 1. Uzyskanie wyników, które będzie można przełożyć na pozostałe zebrane dane
 2. Poszukiwanie rozwiązań, które mogłyby zostać wykorzystane w innym kontekście (np. innych testów lub innych państw)
 3. Wykorzystanie technik, które zminimalizują prawdopodobieństwo wystąpienia dwóch identycznych rozwiązań.

Aby zachęcić zespoły do uczestnictwa we wszystkich trzech etapach postanowiliśmy dodatkowo zaoferować osobną nagrodę dla zwycięzcy wszystkich trzech faz (sumaryczna liczba punków za trzy fazy plus opinia sędziów).
Kluczowe daty dotyczące faz konkursu są podane poniżej. Dla każdej z faz zostanie przyznany ‘wyczyszczony’ zbiór danych (minimum 1000 osób), więc można będzie od razu zacząć analizę. Udostępnimy również krótki opis, aby lepiej zrozumieć temat i krótką lekturę dla tych, którzy chcieliby się w niego wgłębić.

Rejestracja

Aby wziąć udział w konkursie należy zarejestrować zespół przez formularz, który zostanie udostępniony 1 lipca 2016 roku. Zespół definiowany jest, jako drużyna składająca się od 1 do 3 członków.

Rejestracja będzie otwarta do ostatniego dnia trwania konkursu (to jest 21 sierpnia 2016 roku).

Zalecamy wcześniejszą rejestrację, gdyż jest to najlepszy sposób na wzięcie udziału we wszystkich trzech fazach konkursu. Dodatkowo jest wtedy możliwość upewnienia się, czy uczestnik posiada wszystkie niezbędne informacje.

Etapy konkursu

Konkurs został podzielony na trzy niezależne etapy, dzięki czemu żaden z zespołów nie będzie miał znaczącej przewagi nad innymi (w zakresie jednego etapu). Dane zostaną udostępnione odpowiednio wcześniej poprzez GitHub.

Etap 1

Temat: „Różnice płci w zadaniach poznawczych.”

Etap 2

Temat: „Przewidywanie wyniku testów matematycznych na podstawie błędów i czasu odpowiedzi.”

Etap 3

Temat: „Wpływ czynników socjo-ekonomicznych na rozwój umiejętności czytania i pisania”

 • Udostępnienie informacji ogólnych – 29 Lipca 2016
 • Udostępnienie zbioru danych – 5 Sierpnia 2016
 • Termin przesyłania odpowiedzi – 21 Sierpnia 2016, do godziny 23:59

Rozwiązania

Jedynym akceptowalnym narzędziem wykorzystanym do wygenerowania wyników jest R (inne narzędzia mogą być wykorzystane m.in. do oczyszczenia danych, ale powinno to zostać zaznaczone przy przesłaniu rozwiązania). W przypadku, gdy zbiór danych (CSV) zostanie zmodyfikowany, powinien on zostać również przesłany.

Kod R wraz z ewentualnym zmodyfikowanym zbiorem danych powinien zostać przesłany na wskazany w późniejszym terminie adres.

Pytania, które powstaną w trakcie prac mogą być przesłane zarówno w języku polskim jak i angielskim.

Nagrody

 • Certyfikat dla każdego zespołu, który weźmie udział w konkursie i prześle rozwiązanie co najmniej jednego etapu
 • 500 zł dla zwycięskiego zespołu pierwszego etapu
 • 500 zł dla zwycięskiego zespołu drugiego etapu
 • 500 zł dla zwycięskiego zespołu trzeciego etapu
 • 500 zł dla najlepszego zespołu (sumaryczny wynik dla trzech faz)

Nagrody zostaną wręczone podczas ‘ceremonii’ wręczenia nagród, która odbędzie się pod koniec sierpnia w Krakowie.

Istnieje prawdopodobieństwo, że wyniki konkursu zostaną opublikowane w czasopismach naukowych.

Zainteresowany współpracą?

Jest dużo więcej zbiorów danych i jeszcze więcej pytań, do których warto poszukać odpowiedzi. Jeżeli jesteś wykładowcą, który naucza analizy danych za pomocą R i chciałbyś wykorzystać ciekawy zbiór danych na swoich zajęciach, skontaktuj się ze mną (Ian Smythe).

Back to top

Do-IT Profiler Newsletter Subscription