Semantic Scholar
Семантичне вчення[джерело?], англ. Semantic Scholar — це дослідницький інструмент для наукової літератури на основі штучного інтелекту, розроблений в Інституті ШІ ім. Аллена та оприлюднений у листопаді 2015 року.[3] Він використовує досягнення в обробці природної мови для створення резюме для наукових робіт.[4] Команда Semantic Scholar активно досліджує використання штучного інтелекту в оброблянні природної мови, машинному навчанні, взаємодії людини з комп'ютером і пошуку інформації.[5]
Semantic Scholar | |
---|---|
Посилання | semanticscholar.org |
Тип | Пошукова система |
Автор | Інститут штучного інтелекту ім. Аллена[en] |
Започатковано | 2 листопада 2015[1] |
Рейтинг Alexa | 758[2] |
Semantic Scholar починався як база даних, присвячена темам інформатики, геонауки та нейронауки.[6] Однак у 2017 році система почала включати до свого корпусу біомедичну літературу[en].[6] Станом на вересень 2022 року вони налічували понад 200 мільйонів публікацій з усіх галузей науки.[7]
Технології
Semantic Scholar надає короткий виклад наукової літератури(Scientific literature) одним реченням. Однією з його цілей було вирішення проблеми читання численних заголовків і довгих анотацій на мобільних пристроях.[8] Цей інструмент також сприяє тому, щоб три мільйони наукових робіт, які публікуються щорічно, досягли читачів, оскільки, за оцінками, лише половина цієї літератури коли-небуть читається.[9]
Штучний інтелект використовується для вловлення змісту публікації, генеруючи його за допомогою «абстрактної» техніки.[4] У проекті використовується поєднання машинного навчання, обробляння природної мови та машинного бачення, щоб додати рівень семантичного аналізу до традиційних методів аналізу цитування та витягти відповідні цифри, таблиці, сутності та місця проведення з документів.[10][11]
На відміну від Google Scholar і PubMed, Semantic Scholar призначено для виділення найважливіших і впливових елементів публікації.[12] Технологія ШІ має виявляти, приховані зв'язки і зв'язки між темами досліджень.[13] Як і раніше, цитовані пошукові системи, Semantic Scholar також використовує графові структури, які включають Microsoft Academic Knowledge Graph, Springer Nature's SciGraph і Semantic Scholar Corpus.[14]
Кожній статті, розміщеній у Semantic Scholar, присвоюється унікальний ідентифікатор під назвою Semantic Scholar Corpus ID (скорочено S2CID). Наступний запис є прикладом:
- Liu, Ying; Gayle, Albert A; Wilder-Smith, Annelies; Rocklöv, Joacim (March 2020). The reproductive number of COVID-19 is higher compared to SARS coronavirus. Journal of Travel Medicine. 27 (2). doi:10.1093/jtm/taaa021. PMID 32052846. {{S2CID|211099356}}.
Semantic Scholar є безкоштовним у використанні та на відміну від подібних пошукових систем (тобто Google Scholar) не шукає матеріали, які знаходяться «за стіною» платного доступу.[15][6]
Одне дослідження порівнювало пошукові можливості Semantic Scholar за допомогою систематичного підходу та виявило, що пошукова система була точною на 98,88 % при спробі розкрити дані.[15] У цьому ж дослідженні вивчалися інші функції Semantic Scholar, включно з інструменти для опитування метаданих, а також кілька інструментів цитування.[15]
Кількість користувачів і публікацій
Станом на січень 2018 року, після проєкту 2017 року, який додав біомедичні статті та резюме тем, корпус Semantic Scholar включав понад 40 мільйонів робіт з інформатики та біомедицини.[16] У березні 2018 року Даг Реймонд, який розробляв ініціативи машинного навчання для платформи Amazon Alexa, був найнятий для керівництва проектом Semantic Scholar.[17] Станом на серпень 2019 року кількість включених метаданих статей (не фактичних PDF-файлів) зросла до понад 173 мільйонів[18] після додавання записів Microsoft Academic Graph.[19] У 2020 році партнерство між Semantic Scholar і University of Chicago Press Journals зробило всі статті, опубліковані в University of Chicago Press, доступними в корпусі Semantic Scholar.[20] Наприкінці 2020 року Semantic Scholar проіндексувало 190 мільйонів документів.[21]
У 2020 році кількість користувачів Semantic Scholar досягла семи мільйонів на місяць.[8]
Див. також
- Citation analysis – Examination of the frequency, patterns, and graphs of citations in documents
- Citation index — Index of citations between publications
- Knowledge extraction — Creation of knowledge from structured and unstructured sources
- List of academic databases and search engines
- Scientometrics — Study of measuring and analysing science, technology and innovation
Примітки
...the publicly available corpus compiled by Semantic Scholar — a tool set up in 2015 by the Allen Institute for Artificial Intelligence in Seattle, Washington — amounting to around 200 million articles, including preprints.