Was ist der Wissensgraph von LinkedIn?
As Das LinkedIn-Engineering-Team hat es formuliert:
Der Wissensgraph von LinkedIn ist eine große Wissensdatenbank, die auf „Entitäten“ auf LinkedIn aufgebaut ist, wie z. B. Mitglieder, Jobs, Titel, Fähigkeiten, Unternehmen, geografische Standorte, Schulen usw. Diese Entitäten und die Beziehungen zwischen ihnen bilden die Ontologie der Berufswelt und werden von LinkedIn verwendet, um seine Empfehlungssysteme, Suche, Monetarisierung und Verbraucherprodukte zu verbessern, und Geschäft und Verbraucheranalyse.
Wenn Sie nicht wissen, wie ein Wissensgraph funktioniert, think davon als ein System aus Knoten und Kanten. Wobei die Knoten die Dinge sind, die auf LinkedIn existieren (Jobs, Fähigkeiten, Unternehmen usw.) und die Kanten die Beziehungen zwischen ihnen sind.
Wie sieht der LinkedIn Knowledge Graph aus?
Durch den Aufbau eines Diagramms auf der Grundlage von Entitäten und Beziehungen zwischen ihnen können dank dieses Diagramms neue Beziehungen entstehen. Denken Sie an den Fall, in dem Sie eine Fähigkeit haben, aber für den Job, den Sie suchen, auch andere Fähigkeiten benötigen. Basierend auf Ihren Jobpräferenzen kann LinkedIn die Fähigkeiten ableiten, die Sie benötigen, um diese Jobs zu bekommen, und Ihnen so einen Vorschlag zum Erlernen dieser Fähigkeiten machen:
Quelle: engineering.linkedin.com
Warum ist der Wissensgraph entscheidend, um LinkedIn intelligenter zu machen?
LinkedIn Knowledge Graph ist das wichtigste Kapital des Unternehmens
Der Aufbau einer großen Wissensbasis ist eine große Herausforderung. Websites wie Wikipedia und Freebase sind in erster Linie auf direkte Beiträge von menschlichen Freiwilligen angewiesen. Andere verwandte Arbeiten, wie z Google's Wissenstresor und Microsoft's Satori konzentriert sich auf das automatische Extrahieren von Fakten aus dem Internet zum Aufbau von Wissensbasen. Im Gegensatz zu diesen Bemühungen leiten wir den Knowledge Graph von LinkedIn hauptsächlich aus a große Menge an nutzergenerierten Inhalten von Mitgliedern, Personalvermittler, Werbetreibende und Unternehmensadministratoren und ergänzen sie mit Daten, die aus dem Internet extrahiert werden, das verrauscht ist und Duplikate enthalten kann. Der Wissensgraph Bedürfnisse zu Treppe Wenn sich neue Mitglieder registrieren, werden neue Stellen ausgeschrieben, neue Unternehmen, Fähigkeiten und Titel erscheinen in Mitgliederprofilen und Stellenbeschreibungen usw.
Quelle: engineering.linkedin.com
Entitäten werden auf zwei Arten erstellt:
- Organische Entitäten werden von Benutzern generiert (Explicit): Wenn Sie Ihr Profil zusammenstellen, erstellen Sie Daten für LinkedIn Knowledge Graph. Zum Beispiel, wenn Sie Ihrem Profil ein Unternehmen hinzufügen. Gleichzeitig hat dieses Unternehmen eine Seite, die von einem anderen Benutzer verwaltet wird, mit relevanten Informationen über dieses Unternehmen. Das sind Daten, auf denen LinkedIn aufbauen kann smart Infrastruktur, die auf den Graphen angewiesen ist. Das LinkedIn-Engineering-Team nennt diese von Mitgliedern generierten Entitätsbeziehungen „explizit“.
- Automatisch erstellte Entitäten werden von LinkedIn generiert (abgeleitet): Stellen Sie sich den Fall vor, in dem Sie in Ihrem Profil den Namen des Unternehmens eingegeben haben. Nehmen wir an, Sie haben es falsch geschrieben. Trotzdem muss LinkedIn einen Mechanismus haben, um diesen Fehler zu beheben, um zu vermeiden, dass Daten in seinem Knowledge Graph verlegt werden. Was tut es? Ganz einfach, einige LinkedIn-Algorithmen schlussfolgern, was Sie gemeint haben, und beheben den Fehler. Wie Sie sich vorstellen können, können die von Benutzern generierten organischen Inhalte (sogenannte explizite) viele Fehler aufweisen.
Wie erstellt LinkedIn Entitäten automatisch?
LinkedIn sucht unter den Daten, die es in den Profilen der Mitglieder findet, nach Entitätskandidaten. Dazu gehören Informationen zu Zehntausenden von Fähigkeiten, Titeln, Standorten, Unternehmen, Zertifikaten und so weiter. Das sind die Entitäten in LinkedIn Knowledge Graph. Diese Entitäten repräsentieren die Knoten.
Der Prozess folgt vier Schritten:
- Kandidaten generieren: Betrachten Sie sie als einfache englische Sätze (wie „Gennaro erstellt FourWeekMBA.com“)
- Entitäten disambiguieren: ein Satz kann je nach Kontext eine Bedeutung haben. Somit ermöglicht dieser Prozess die Identifizierung der Bedeutung einer Phase gemäß dem Kontext, in dem sie sich befindet
- Entitäten deduplizieren: mehrere Phrasen, die dieselbe Entität darstellen könnten, werden in Wortvektoren organisiert und geclustert
- Entitäten in andere Sprachen übersetzen: Die Entitäten der obersten Ebene werden übersetzt, um eine hohe Genauigkeit zu ermöglichen
Quelle: engineering.linkedin.com
Der Knowledge Graph baut auf Taxonomien auf. Aus dem obigen Beispiel können Sie die hierarchische Struktur sehen Struktur der Taxonomie. Wo Sie eine Gruppe von Begriffen haben, wie z. B. „Software Engineer“, „Developer“ oder „Programmer“, die unter „Software Developer“ gruppiert sind. Welches ist unter "Engineering".
Diese Taxonomien sind auf zwei Arten organisiert:
- Beziehungen zu anderen Entitäten in einer Taxonomie: Denken Sie an all die Verbindungen zwischen mehreren Entitäten. Zum Beispiel, wie Unternehmen, Mitglieder, Fähigkeiten und Branchen miteinander verbunden sind
- und charakteristische Merkmale, die in keiner Taxonomie enthalten sind: think aller Metadaten (Daten über Daten). Zum Beispiel das Firmenlogo, Einnahmen, URL und so weiter
Dadurch kann LinkedIn einen Wissensgraphen erstellen, bei dem die Beziehungen die Kanten sind, während die Entitäten oder Dinge im Diagramm die Knoten sind.
Woher bekommt LinkedIn die Daten, um diese Beziehungen und Entitäten zu erstellen?
Das LinkedIn-Engineering-Team bezeichnet es als „LinkedIn-Ökosystem“. Diese besteht aus einigen Hauptteilen:
- Die Zuordnungen von Mitgliedern zu anderen Entitäten (wie die Fähigkeiten jedes Mitglieds) sind entscheidend für Dinge wie Anzeigenausrichtung, Personensuche, Rekrutierersuche, Feed usw Geschäft und Verbraucheranalysen;
- die Zuordnungen von Jobs zu anderen Entitäten (wie die für Jobs erforderlichen Fähigkeiten) sind stattdessen entscheidend, um Jobempfehlungen und Jobsuche voranzutreiben;
Wie wir gesehen haben, ist ein entscheidender Aspekt des LinkedIn Knowledge Graph die Produktion von Daten. Wir haben zwei Arten von Daten gesehen: explizite und abgeleitete. Wie funktioniert es praktisch?
Explizite vs. abgeleitete LinkedIn generierte Daten und Beziehungen
In dem Artikel von LinkedIn ist das Engineering-Team interessant, die nutzergenerierten Daten zu vergleichen, was LinkedIn als explizit bezeichnet. Mit den vom LinkedIn-Algorithmus automatisch generierten Daten, die implizit genannt werden. Als Beispiel gibt es eine interessante Fallstudie:
Quelle: engineering.linkedin.com
Auf der linken Seite sehen Sie die vom Mitglied generierten Fähigkeiten (wie „Verteilte Systeme“, „Hadoop“, „Skalierbarkeit“ usw.). Auf der rechten Seite sehen Sie die abgeleiteten Fähigkeiten mit einem gewissen Maß an Vertrauen („Produktmanagement“, „Management“, „Beratung“, „Netzwerken“ usw.).
Mit anderen Worten, neben den Fähigkeiten, auf die Sie in Ihrem Profil hinweisen, berechnet der LinkedIn-Algorithmus eine Reihe von Fähigkeiten, um sicherzustellen, dass die benutzergenerierten Inhalte ausgeglichen sind.
Der LinkedIn Knowledge Graph in Aktion
Wie bisher angegeben, was LinkedIn ausmacht Plattform dick sind die Informationen und Daten, die in einem großen Wissensgraphen organisiert sind, der aus Knoten und Kanten besteht. Diese riesige Datenbank wird technisch als GraphDB (Graph Database) bezeichnet. Dies ist äußerst effektiv, da es Plattformen wie LinkedIn ermöglicht Treppe oben:
Graphdatenbanken glänzen, wenn Sie versuchen, Entitäten (Knoten) entlang von Beziehungen (Kanten) miteinander in Beziehung zu setzen. Zusätzlich zu den neuen Funktionalitäten ist die GraphDB bei LinkedIn stark optimiert und kann Millionen von Abfragen pro Sekunde bei sehr geringen Latenzen unterstützen.
Schlüssel zum Mitnehmen
LinkedIn Algorithmen sind viel intelligenter geworden. KI- und maschinelle Lernmodelle benötigen jedoch viele Daten, um sich zu verbessern. Der effiziente Umgang mit der riesigen Datenmenge wird entscheidend. Der Knowledge Graph ist die Infrastruktur, die genau das ermöglicht. Es ermöglicht den schnellen und effizienten Umgang mit komplexen, strukturierten und großen Datenmengen. Aus diesem Grund ist es auch wichtig zu verstehen, wie ein Wissensgraph funktioniert, um zu verstehen, wie sich diese Plattformen entwickeln.
Other companies that manage a massive amount of metadata (data about data), like Facebook funktioniert Google verwenden dieselbe Art von Infrastruktur.
Ressourcen für Ihre Geschäft:
- Was ist ein Geschäftsmodell? 30 erfolgreiche Arten von Geschäftsmodellen, die Sie kennen müssen
- Was ist ein Business Model Canvas? Business Model Canvas erklärt
- Marketing vs. Vertrieb: So nutzen Sie Vertriebsprozesse zum Wachstum Ihres Unternehmens
- Was ist Geschäftsentwicklung? Der vollständige Leitfaden zur Geschäftsentwicklung
Handverlesene beliebte Fallstudien von der Website:
- Die Stärke des Google-Geschäftsmodells auf den Punkt gebracht
- Wie verdient Google Geld? Es ist nicht nur Werbung!
- Wie Amazon Geld verdient: Das Amazon-Geschäftsmodell in Kürze
- Wie verdient Netflix Geld? Netflix-Geschäftsmodell erklärt
- Wie verdient Spotify Geld? Das Spotify-Geschäftsmodell auf den Punkt gebracht
- The Billion Dollar Company: Das Apple-Geschäftsmodell auf den Punkt gebracht
- DuckDuckGo: Der [ehemalige] Solopreneur, der Google in seinem Spiel schlägt