Ihre Organisation mit Kaggle in ML/KI weiterbilden

1. Einführung

47566e1490c16443.png

Zuletzt aktualisiert:10.05.2024

Was ist Kaggle?

Kaggle ist die größte KI- und Die ML-Community ist die ultimative Plattform für begeisterte Data-Science- und ML-Begeisterte aller Niveaus, um mit den neuesten Techniken und Technologien auf dem neuesten Stand zu bleiben. Entdecken Sie ein umfangreiches Repository mit Datasets, Notebooks und vortrainierten Modellen für den Start in Ihr nächstes Projekt. Nimm an Wettbewerben teil, lerne von Kursen und tausche dich mit einer vielfältigen Community aus über 18 Millionen Nutzern aus der ganzen Welt aus. Ganz gleich, ob Sie Einsteiger oder erfahrener Profi sind, Kaggle ist der Ort, an dem Sie Ihre Fähigkeiten verbessern, der Konkurrenz einen Schritt voraus bleiben und an innovativen Projekten mitarbeiten können.

Inhalt

In diesem Codelab erstellen, konfigurieren und starten Sie einen Kaggle-Wettbewerb. Sie lernen die Erfahrungen der Konkurrenz und die Best Practices für die Durchführung eines ansprechenden Wettbewerbs kennen.

Aufgaben in diesem Lab

  • Verstehen, wie man einen Kaggle-Wettbewerb aufseiten des Hosts erstellt und verwaltet
  • Den Umgang mit Mitbewerbern durchgehen – von der Erkundung bis zur Einreichung
  • Lernen Sie Best Practices für einen ansprechenden Wettbewerb kennen.

Dieses Codelab konzentriert sich darauf, schnell einen Wettbewerb zu erstellen, und nutzt die wachsende Wettbewerbsbibliothek von Kaggle.

Voraussetzungen

  • Einen aktuellen Webbrowser
  • Grundkenntnisse in Python

2. Einrichtung

Kaggle-Konto erstellen

Besuchen Sie die Kaggle-Website (https://www.kaggle.com/) und klicken Sie auf „Register“ (Registrieren). um ein kostenloses Konto zu erstellen.

Konto bestätigen

  1. Klicken Sie rechts oben auf der Seite auf Ihr Profilbild.
  2. Klicken Sie auf „Mein Profil“.
  3. Klicken Sie auf „Einstellungen“. Schaltfläche rechts neben dem Profilinhalt
  4. Unter „Bestätigung der Telefonnummer“ befolgen Sie die Anweisungen zur Bestätigung Ihres Kontos.

3. Ersten Wettbewerb erstellen

Jetzt neu: KI-generierte Wettbewerbsvorlagen

„AI Generated Competitions“ ist eine neue Funktion auf Kaggle, mit der Nutzer schnell und einfach Wettbewerbe für maschinelles Lernen erstellen können. Es nutzt KI, um synthetische Datasets zu generieren, die die statistischen Eigenschaften vorhandener Datasets nachahmen, ohne personenidentifizierbare Informationen zu enthalten.

So funktionierts:

  1. Vorlage auswählen: Wählen Sie eine Vorlage aus einer Liste aus, die auf verschiedenen Aufgaben des maschinellen Lernens basiert (z.B. Klassifizierung, Regression).
  2. KI generiert ein Dataset: Die KI von Kaggle erstellt anhand Ihrer ausgewählten Vorlage ein neues Dataset für Ihre Konkurrenz. Dieses Dataset ähnelt dem Original, verwendet jedoch einen Teil der Features und hat geringfügig abweichende Featureverteilungen.
  3. Wettbewerb anpassen: Geben Sie grundlegende Details wie Name, Beschreibung und Zeitplan ein. Außerdem können Sie die Datenschutzeinstellungen für Ihre Mitbewerber festlegen.
  4. Einführung: Nachdem Sie die Details festgelegt und die Einführung festgelegt haben, können Sie Ihren Wettbewerb auf den Markt bringen.

Diese Funktion optimiert die Erstellung von Wettbewerben, da sie mehr Nutzern zugänglich wird und es ihnen ermöglicht, sich auf die Aspekte des maschinellen Lernens zu konzentrieren, anstatt sich auf die Dataset-Vorbereitung zu konzentrieren.

Einen Wettbewerb erstellen

Rufen Sie https://www.kaggle.com/competitions/new auf und wählen Sie „New AI Generated Competition“ aus.

2629bf77a282a46c.png

Wählen Sie die „Regression with a Crab Age Dataset“ (Regression mit einem Crab Age-Dataset) aus. Wettbewerb

Details zum Wettbewerb

2dd2228b9d686a6e.png

Geben Sie einen aussagekräftigen Namen und einen Untertitel ein. Sie könnten zum Beispiel „<Your Names>'s Test Crab Competition“ verwenden. als Titel und „Ich erstelle meinen ersten Wettbewerb, um zu sehen, wie er funktioniert“. als Untertitel. Die URL des Wettbewerbs wird automatisch anhand des Titels eingefügt.

Sichtbarkeit und Zugriff

Nun müssen wir die Sichtbarkeit und den Zugriff für den Wettbewerb festlegen.

5c7dcae412ddd574.png

Sichtbarkeit

  • Öffentlich: Ihre Konkurrenz ist für alle Personen auf Kaggle sichtbar. Sie wird in den Suchergebnissen angezeigt und jeder, der interessiert ist, kann beitreten.
  • Privat: Der Wettbewerb ist nicht öffentlich sichtbar. Sie erscheint nicht in Suchergebnissen und nur von Ihnen eingeladene Personen können teilnehmen.

Wer kann beitreten?

  • Jeder: Das ist wie eine Richtlinie zur offenen Tür. An Ihrer Konkurrenz kann sich jeder auf Kaggle beteiligen.
  • Nur Personen mit einem Link: Diese Option ist eine exklusivere Option. Sie erstellen einen speziellen Link, an dem nur Personen teilnehmen können, die über diesen Link verfügen.
  • Eingeschränkte E-Mail-Liste: Das ist die am stärksten kontrollierte Option. Sie stellen eine Liste mit bestimmten E-Mail-Adressen oder Domains (z. B. @ihrebildungseinrichtung.edu) bereit und nur Personen mit diesen Adressen können teilnehmen.

Wir sprechen später noch mehr über die Einstellung Notebooks und Modelle aktivieren. Achten Sie vorerst darauf, dass die Option aktiviert ist. Für unseren Beispielwettbewerb wurden diese Einstellungen auf Privat und Nur Personen mit dem Link festgelegt.

Lies dir die Nutzungsbedingungen durch und klicke auf Wettbewerb erstellen.

4. Die Konkurrenz verstehen und konfigurieren

Hinter den Kulissen haben wir einen völlig neuen Wettbewerb mit einem einzigartigen Datensatz erstellt. Sehen wir uns kurz die Einstellungen für den Wettbewerb an.

Tab „Host“

Der Tab "Host" enthält alles, was Sie als Host zur ordnungsgemäßen Konfiguration Ihrer Konkurrenz benötigen. Sehen Sie sich insbesondere die Seitenliste rechts auf der Seite an:

bcedd6768cc4f32c.png

Allgemeine Angaben

Dieser Abschnitt umfasst Folgendes:

  • Allgemein
  • Datenschutz, Zugriff und Ressourcen
  • Zeitachse
  • Bewertung und Mannschaften

Beim Start des Wettbewerbs haben wir die Abschnitte „Allgemein“ und „Datenschutz“ besprochen.

Zeitplan

Das Enddatum des Wettbewerbs ist zeitzonenbasiert.

7141f4aea90bccb0.png

Wertung und Ihr Team

Die Bewertung und Im Teambereich können Sie steuern, wie viele Personen einem Team beitreten können, wie oft sie jeden Tag einreichen können und wie viele ihrer Beiträge sie für die endgültige Bewertung auswählen müssen.

5efb6387612db941.png

Bilder

Mit der Funktion „Bilder“ können Sie das Banner und die Miniaturansicht für Ihre Mitbewerber anpassen. Dies wirkt sich sowohl auf die Startseite des Wettbewerbs als auch auf den Eintrag Ihres Wettbewerbs aus.

6dfd442376a1c702.png

Hosts

Hier können Sie andere Kaggle-Nutzende als Host für Ihren Wettbewerb hinzufügen. Andere Hosts haben vollständigen Zugriff (einschließlich der Einführung) auf Ihre Konkurrenz.

8f8c90eb6baa7747.png

Bewertungsmesswert

Der Tab „Bewertungsmetriken“ ist das Herz des Wettbewerbs. Wenn Sie einen Wettbewerb von Grund auf neu erstellen, sollten Sie sich genau überlegen, welcher Bewertungs- oder Bewertungsmesswert verwendet werden soll. Dann laden Sie Ihre Lösungsdatei hoch, definieren die öffentliche und private Testaufteilung und stellen eine Beispieleinreichung bereit. Da wir jedoch einen generierten Wettbewerb verwendet haben, ist dies nicht erforderlich.

Bewertungsmesswert

Damit wird festgelegt, wie eine Einreichung im Vergleich zur Lösungsdatei bewertet wird. Für jeden Messwert sind eine Dokumentation und ein tatsächlicher Code verfügbar.

Lösungsdatei

Da wir einen generierten Wettbewerb verwenden, ist diese Datei einzigartig für Ihren Wettbewerb.

89fa1f42d177505a.png

Mit der Lösungsstichprobe können Sie die Menge der Lösungsdatei anpassen, die zur Bewertung von Beiträgen während des Wettbewerbs (öffentliche Bestenliste) verwendet wird, im Vergleich dazu, wie viele Zeilen zur Bestimmung der endgültigen Bestenliste verwendet werden. Während des Wettbewerbs können Nutzer anhand der Einstellung für bewertete private Beiträge auswählen, welche ihrer Beiträge für die endgültige Bestenliste (hier als private Bestenliste bezeichnet) verwendet werden.

Dieser Prozess stellt sicher, dass die Konkurrenz nicht für eine Überanpassung oder eine Flut mit Beiträgen belohnt wird.

Sandbox-Übermittlungen

So können Wettbewerbsbetreiber sicherstellen, dass die Bewertung wie erwartet funktioniert, und ermöglichen es ihnen, eine Benchmark festzulegen. mit denen die Konkurrenz verglichen werden kann. Diese Benchmark-Einreichungen werden in der Bestenliste angezeigt.

Teams und Beiträge

Während des Wettbewerbs können die Gastgeber alle Ergebnisse herunterladen und die Teams verwalten. Dieses Feld ist vor Beginn des Wettbewerbs leer.

Launch Checklist

Dies wird im nächsten Abschnitt behandelt.

5. Ihre Mitbewerber starten

50b03df072c02e6a.png

Klicken Sie oben auf der Wettbewerbsseite auf die Start-Checkliste. Schaltfläche.

Launch Checklist

Die Start-Checkliste zeigt die erforderlichen Schritte vor dem Start eines Wettbewerbs. Da wir bereits mit einer Wettbewerbsvorlage begonnen haben, sind die meisten dieser Schritte bereits abgeschlossen! Es fehlen nur noch zwei Aufgaben: die Festlegung einer Frist und die Aktualisierung der Wettbewerbsregeln.

938b9ed7bc4e0597.png

Frist festlegen

Klicken Sie zunächst auf den Pfeil neben "Termin festlegen". Wettbewerbe dauern in der Regel mindestens ein paar Monate. Die maximale Dauer eines Wettbewerbs beträgt ein Jahr.

Regeln bearbeiten

Ihre Wettbewerbsregeln müssen vor der Einführung anhand der Standardvorlage aktualisiert werden. Wenn Sie diesen Wettbewerb für eine Klasse oder eine Gruppe durchführen, ist dies ein guter Ort, um Informationen über Erwartungen zu teilen.

Launch

Wir sind bereit für die Einführung! Starten Sie Ihren Wettbewerb! Sie sind nun bereit für die Konkurrenz!

6. Mitbewerbererfahrung

Nachdem Sie nun Ihre Mitbewerber herausgebracht haben, schauen wir uns an, wie die Konkurrenzunternehmen aussehen. Wir zeigen Ihnen, wie Sie am Wettbewerb teilnehmen und Ihre Einreichung einreichen können. Dazu können Sie hier am Google-I/O-Demowettbewerb teilnehmen: https://www.kaggle.com/competitions/google-io-demo-competition

Am Wettbewerb teilnehmen

Rufe die Startseite des Wettbewerbs auf und klicke auf den Link "Am Wettbewerb teilnehmen". und bestätigen Sie die Regeln.

Erste Einreichungen

Wechseln Sie zum Tab „Code“ und klicken Sie auf „Neues Notebook“. Daraufhin wird ein Notizbuch geöffnet, in dem Sie Ihre Bewerbung einreichen können.

Zuerst lesen wir die Trainings- und Testdaten.

ᰃ# Test- und Zugdaten lesen

train = pd.read_csv('/kaggle/input/google-io-demo-competition/train.csv')

test = pd.read_csv('/kaggle/input/google-io-demo-competition/test.csv')

Sehen wir uns die Daten an.

ᰃ#: Werfen wir einen Blick auf einige der Daten.

train.head()

Bereiten wir die Daten für das Training vor. In diesem Fall schließen wir "Sex" aus, weil es sich nicht um einen numerischen Wert handelt. (Tipp: Wenn Sie herausfinden, wie Sie diese hinzufügen, sollte sich die Leistung Ihres Modells verbessern.)

ᰃ # entfallen die Testergebnisse in den Testdaten.

data = train.drop(columns=['Alter', 'Sex'])

Antworten = train['Alter']

Dann erstellen wir ein Modell. In diesem Fall erstellen wir ein Random Forest-Modell.

ᰃ# Importe für das Modell

aus sklearn.model_selection import train_test_split

aus sklearn.ensemble RandomForestRegressor importieren

aus sklearn.metrics import mean_absolute_error

model = RandomForestRegressor()

# Modell trainieren

model.fit(data; answers)

Beitrag erstellen:

ᰃvorhersages = model.predict(test.drop(columns=[‘Sex']))

submission = pd.DataFrame({‘id&#39;: test[‘id&#39;], ‘Age&#39;: predictions})

Übermittlung.to_csv('submission.csv', index=False)

Anschließend können Sie Ihre Bewerbung für den Wettbewerb einreichen, indem Sie auf "Zum Wettbewerb einreichen" klicken. im Menü auf der rechten Seite.

1cf17449cae53abe.png

Tipps für tolle Wettbewerbe

  1. Fügen Sie ein Starter-Notebook hinzu, über das eine einfache
  2. Fördern Sie die Nutzung der Diskussionen und das Teilen von Notizbüchern zu Beginn des Wettbewerbs.
  3. Spaß haben