Tuesday, October 1, 2024
HomeKryptoTop 10 Websites, die Ihnen helfen, Daten für Ihr nächstes Data Science-Projekt...

Top 10 Websites, die Ihnen helfen, Daten für Ihr nächstes Data Science-Projekt abzurufen

- Advertisement -

Hier sind die Top-10-Websites, die Ihnen beim Abrufen von Daten für Ihr nächstes Data-Science-Projekt helfen werden

Wenn Sie nach einer Aufgabe in suchen Datenanalyse In Datenwissenschaft, benötigen Sie ein Portfolio, um Ihre Beherrschung zu demonstrieren. Offensichtlich, wenn Sie neu in der Datenanalyse sind, haben Sie höchstwahrscheinlich nicht viel Geschick! Kein nennenswerter Grund für Stress. Die Tatsache, dass Sie sich wahrscheinlich noch nicht mit einem bezahlten Unternehmen befasst haben, bedeutet nicht, dass Sie mit einigen kein überzeugendes Portfolio erstellen können Trainingsdatensätze.

Glücklicherweise ist das Web mit diesen überschwemmt, von denen der größte Teil heruntergeladen werden darf (aufgrund des offenen Informationsantriebs). Hier stellen wir ein paar erstklassige Tresore vor, in denen Sie Daten zu allem aufspüren können, von Geschäft bis Rücken, Planetenwissenschaft und Fehlverhalten.

10 Websites, um wunderbare Datensätze für Ihre zu erhalten Data Science-Projekte:

  1. Googles Datensatzsuche:

Die Datensatzsuche von Google ist Google sehr ähnlich, jedoch für Informationssammlungen. Sie geben Ihre Frage ein und Google gibt zahlreiche zurück Datensätze wie es in dieser Angelegenheit hat.

Wenn ich mir zum Beispiel „Katzen“ anschaue, komme ich nördlich von 100 Datensätzen, darunter ein Datensatz mit mehr als 9.000 Bildern von Katzen. Sie können umdrehen, um nur kostenlose Datensätze einzubinden. Es nimmt die Einstellung für Sie heraus, sodass Sie eine gewisse Klärung darüber erhalten, was dieser Datensatz ist und warum er erfasst wurde.

  1. Kaggle:

Kaggle’s Datasets ist ebenfalls ein Webindex, aber gleichzeitig eingeschränkter und aktiver.

Es ist eingeschränkter, weil es nur Datensätze zurückhält, die Einzelpersonen mit Kaggle verteilt haben. Es ist jedoch ansprechender, da die Datensätze nicht einfach eine unregelmäßige Anordnung von Zahlen sind, die Google zerkratzt hat. Kaggle ist ein ständiger Ort für Rivalitäten in der Informationswissenschaft, daher sind die gesammelten Datensätze sehr relevant für die Informationswissenschaft.

Dadurch können Sie Ihr besonderes Interesse kanalisieren. Zum Beispiel kann ich zufällig diesen äquivalenten Katzendatensatz finden, vorausgesetzt, ich habe mit dem „PC Vision“ -Kanal „katzenartig“ ausgesehen.

  1. KDNuggets:

Das mag Sie zutiefst schockieren, aber KDNuggets kuratiert eine unglaubliche Anordnung von Datensätzen. Diese Datensätze sind ausdrücklich für Informationswissenschaft, KI, simulierte Intelligenz und Ermittlungen bestimmt, also sind sie es.

Viele davon sind nicht die besonderen Funktionen von KDNuggets, aber es ist eine anständige Übersicht, in der Sie sich umschauen können. Es ist wichtig, dass Sie, wenn Sie sich als KDNuggets-E-Mail-Endorser anmelden, auch Zugang zu den simulierten Informationen von World Information erhalten, die selbst 3,5 Milliarden enthalten Datensätze.

  1. Regierungsseiten:

Ich könnte diese Liste von Websites ohne großen Aufwand erweitern, um Datensätze auf etwa 1.000.000 zu erhalten, im Grunde indem ich ausschließlich jede der Behördenseiten poste, die ich gerne verwende, um Informationen zu erhalten. Ich werde nicht. Wenn alle Dinge gleich sind, werde ich hier einen kleinen Überblick geben:

  • http://datasf.org/
  • http://data.gov.uk
  • https://www.usa.gov/About/engineer assets/1usagov.shtml
  • https://www.census.gov/information/datasets.html

Gesetzgeber sammeln ständig Informationen, um Studien durchzuführen, und eine beträchtliche Anzahl von ihnen verbreitet diese Informationen im Internet.

  1. Pudding.Cool:

Wenn Sie möchten, dass Ihre Informationen einen mächtigen Teil der Mainstream-Gesellschaft begleiten, suchen Sie nicht weiter als Pudding.cool. Diese Seite betrachtet Themen, die sich geändert haben, wie triste Pop-Strophen, Damentaschen und wie die Theorie des Ursprungs des Universums von der chinesischen Regierung kontrolliert wird.

Dies ist in größerem Maße ein computergestütztes Magazin, das lange Ausstellungen über Kultur verfasst und eine Menge Informationen aus der Nähe zeigt. Ich füge es hier hinzu, da sie großartige Geschichten erzählen und ihre Informationen anbieten.

  1. 538:

Eine weitere artikelgesteuerte Website der Mainstream-Gesellschaft mit öffentlich zugänglichen Informationen, die Sie entwenden können. Sie konzentrieren sich mehr auf Sport und Regierungsfragen. Es ist weniger informationsgetrieben, aber ich gebe ihm einen Platz in diesem Überblick, da es Datensätze organisiert und teilt.

  1. Saubere Dienstage:

Derzeit ist die Wahrheit, dass Informationen häufig in keiner Weise sauber sind. Clean Tuesdays sind im Wesentlichen keine Website mit Datensätzen, aber es ist eine wöchentliche Veranstaltung und ein lokaler Bereich mit einem Schwerpunkt auf der Nutzung von Informationswissenschaft zur Untersuchung chaotischer Informationen.

Konsequenterweise fällt ein neuer Datensatz. Die Mitglieder werden aufgefordert, sich gegenseitig ihre Reinigungsverfahren und -wahrnehmungen auf GitHub und Twitter mitzuteilen.

  1. GitHub:

GitHub ist die Heimat einer Menge Informationen. Sie können zweifellos Informationen suchen, kanalisieren und herunterladen, um sich ganz alleine damit zu beschäftigen. Ungeachtet dessen ist die Informationsqualität ein herausragender Faktor. Da jeder Informationen übertragen kann, befinden sie sich im Allgemeinen nicht in einem außergewöhnlichen Zustand.

  1. Buzzfeed:

Buzzfeed führt nicht einfach Tests durch, die den menschlichen Zustand anmerken, indem es Sie auffordert, eine Portion gemischtes Gemüse zuzubereiten. Es ist vielleicht nicht allzu bekannt dafür, aber Buzzfeed sendet eine Menge wertvoller Informationen.

Es ist auch alles Open Source.

  1. Großartige öffentliche Datensätze:

Ich beende diesen Überblick mit einem offensichtlichen Titel: Wonderful Public Datasets. Dieses Repo lebt auf GitHub und enthält (größtenteils) kostenlose Datensätze zur Untersuchung. Sie stammen aus Online-Datensätzen, Kundenideen und Explorationspapieren.

source – www.analyticsinsight.net

- Advertisement -
RELATED ARTICLES

Most Popular

Recent Comments