banner
Centre d'Information
Excellents intrants, assurance qualité rigoureuse.

Datasaur vous permet de créer automatiquement un modèle à partir d'un ensemble d'étiquettes

Aug 31, 2023

Bien avant que les gens ne parlent de ChatGPT et de l’IA générative, des entreprises comme Datasaur s’occupaient des détails de la création de modèles d’apprentissage automatique, aidant à étiqueter les éléments pour entraîner le modèle. À mesure que l’IA prend son essor, ce type de capacité est devenu encore plus important.

Afin de permettre à davantage d'entreprises ne disposant pas d'un spécialiste de la science des données de créer des modèles, Datasaur a annoncé la possibilité de créer un modèle directement à partir des données de l'étiquette, mettant ainsi la création de modèles à la portée d'un public beaucoup moins technique. Il a également annoncé une extension de démarrage de 4 millions de dollars qui s'est clôturée en décembre dernier.

Le fondateur de l'entreprise, Ivan Lee, affirme que le récent regain d'intérêt pour l'IA a été formidable pour l'entreprise et s'inscrit en fait bien dans la stratégie de la startup. "Ce que Datasaur s'est toujours efforcé d'être, c'est le meilleur endroit pour rassembler les données de formation dont vous avez besoin pour alimenter vos modèles, qu'il s'agisse de LLM ou de modèles NER traditionnels, d'analyses de sentiments ou autre", a déclaré Lee à TechCrunch.

« Nous sommes tout simplement la meilleure interface permettant à ces utilisateurs non experts de venir étiqueter ces données », a-t-il déclaré.

L’essor des LLM contribue à faire prendre conscience en général de la manière dont l’IA peut aider dans un contexte commercial, mais il affirme que la plupart des entreprises en sont encore au stade exploratoire et qu’elles ont encore besoin de produits comme Datasaur pour créer des modèles. Lee affirme que l'un de ses objectifs depuis le début a été de démocratiser l'IA, en particulier autour du traitement du langage naturel, et que la nouvelle fonctionnalité de création de modèles devrait mettre l'IA à la portée d'un plus grand nombre d'entreprises, même celles ne disposant pas d'une expertise spécialisée.

"Et cette fonctionnalité m'enthousiasme particulièrement car elle permet aux équipes sans data scientists, sans ingénieurs de simplement annoter et étiqueter ces données comme bon leur semble, et elle formera automatiquement un modèle pour elles", a déclaré Lee. .

Lee y voit un moyen d’aller au-delà du marché cible initial des data scientists. "Maintenant, nous allons l'ouvrir aux entreprises de construction, aux cabinets d'avocats et aux sociétés de marketing, qui n'ont peut-être pas de formation en ingénierie des données, mais peuvent toujours créer des modèles PNL [basés sur leurs données de formation]."

Il dit qu’il a été en mesure de limiter le montant de ses investissements en capital-risque – le précédent investissement s’élevait à un modeste 3,9 millions de dollars en 2020 – parce qu’il opère de manière modeste. Son équipe d'ingénieurs se trouve principalement en Indonésie et, même s'il envisage d'embaucher, il est fier de gérer l'entreprise de manière efficace.

"Ma philosophie a toujours été la rentabilité, la croissance de manière évolutive, et ne jamais croître à tout prix", a déclaré Lee. Cela signifie qu'il considère chaque embauche et l'impact qu'elle aura sur l'entreprise.

En disposant d'une main-d'œuvre distante et interculturelle, les employés peuvent apprendre les uns des autres, ce qui apporte par nature une diversité à l'entreprise. « Il existe une différence significative dans la culture du lieu de travail entre les États-Unis et la façon dont les choses fonctionnent en Indonésie. Et donc une chose est que nous avons dû être intentionnels pour capturer le meilleur des deux mondes », a-t-il déclaré. Cela pourrait impliquer d’encourager les collègues indonésiens à s’exprimer ou à s’opposer à ce que dit un manager, ce qu’ils sont réticents à faire culturellement. « Nous avons été très proactifs pour encourager cela », a-t-il déclaré.

Mais il dit que les employés américains peuvent également apprendre beaucoup de choses sur la façon dont les choses fonctionnent en Asie, comme le respect de leurs collègues et cette culture qui donne la priorité à l'équipe, et il a dû aider les équipes à gérer ces différences culturelles.

L'investissement de 4 millions de dollars a été dirigé par Initialized Capital avec la participation de HNVR, Gold House Ventures et TenOneTen. L'entreprise a levé un total de 7,9 millions de dollars.