Semantic Scholar

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до навігації Перейти до пошуку
Semantic Scholar
Логотип
Логотип
Посиланняsemanticscholar.org
ТипПошукова система
АвторІнститут штучного інтелекту ім. Аллена[en]
Започатковано2 листопада 2015[1]
Рейтинг Alexa758-2">[2]

Семантичне вчення[джерело?], англ. Semantic Scholar — це дослідницький інструмент для наукової літератури на основі штучного інтелекту, розроблений в Інституті ШІ ім. Аллена та оприлюднений у листопаді 2015 року.[3] Він використовує досягнення в обробці природної мови для створення резюме для наукових робіт.[4] Команда Semantic Scholar активно досліджує використання штучного інтелекту в оброблянні природної мови, машинному навчанні, взаємодії людини з комп'ютером і пошуку інформації.[5]

Semantic Scholar починався як база даних, присвячена темам інформатики, геонауки та нейронауки.[6] Однак у 2017 році система почала включати до свого корпусу біомедичну літературу[en].[6] Станом на вересень 2022 року вони налічували понад 200 мільйонів публікацій з усіх галузей науки.[7]

Технології

[ред. | ред. код]

Semantic Scholar надає короткий виклад наукової літератури(Scientific literature) одним реченням. Однією з його цілей було вирішення проблеми читання численних заголовків і довгих анотацій на мобільних пристроях.[8] Цей інструмент також сприяє тому, щоб три мільйони наукових робіт, які публікуються щорічно, досягли читачів, оскільки, за оцінками, лише половина цієї літератури коли-небуть читається.[9]

Штучний інтелект використовується для вловлення змісту публікації, генеруючи його за допомогою «абстрактної» техніки.[4] У проекті використовується поєднання машинного навчання, обробляння природної мови та машинного бачення, щоб додати рівень семантичного аналізу до традиційних методів аналізу цитування та витягти відповідні цифри, таблиці, сутності та місця проведення з документів.[10][11]

На відміну від Google Scholar і PubMed, Semantic Scholar призначено для виділення найважливіших і впливових елементів публікації.[12] Технологія ШІ має виявляти, приховані зв'язки і зв'язки між темами досліджень.[13] Як і раніше, цитовані пошукові системи, Semantic Scholar також використовує графові структури, які включають Microsoft Academic Knowledge Graph, Springer Nature's SciGraph і Semantic Scholar Corpus.[14]

Кожній статті, розміщеній у Semantic Scholar, присвоюється унікальний ідентифікатор під назвою Semantic Scholar Corpus ID (скорочено S2CID). Наступний запис є прикладом:

Liu, Ying; Gayle, Albert A; Wilder-Smith, Annelies; Rocklöv, Joacim (March 2020). The reproductive number of COVID-19 is higher compared to SARS coronavirus. Journal of Travel Medicine. 27 (2). doi:10.1093/jtm/taaa021. PMID 32052846. {{S2CID|211099356}}.

Semantic Scholar є безкоштовним у використанні та на відміну від подібних пошукових систем (тобто Google Scholar) не шукає матеріали, які знаходяться «за стіною» платного доступу.[15][6]

Одне дослідження порівнювало пошукові можливості Semantic Scholar за допомогою систематичного підходу та виявило, що пошукова система була точною на 98,88 % при спробі розкрити дані.[15] У цьому ж дослідженні вивчалися інші функції Semantic Scholar, включно з інструменти для опитування метаданих, а також кілька інструментів цитування.[15]

Кількість користувачів і публікацій

[ред. | ред. код]

Станом на січень 2018 року, після проєкту 2017 року, який додав біомедичні статті та резюме тем, корпус Semantic Scholar включав понад 40 мільйонів робіт з інформатики та біомедицини.[16] У березні 2018 року Даг Реймонд, який розробляв ініціативи машинного навчання для платформи Amazon Alexa, був найнятий для керівництва проектом Semantic Scholar.[17] Станом на серпень 2019 року кількість включених метаданих статей (не фактичних PDF-файлів) зросла до понад 173 мільйонів[18] після додавання записів Microsoft Academic Graph.[19] У 2020 році партнерство між Semantic Scholar і University of Chicago Press Journals зробило всі статті, опубліковані в University of Chicago Press, доступними в корпусі Semantic Scholar.[20] Наприкінці 2020 року Semantic Scholar проіндексувало 190 мільйонів документів.[21]

У 2020 році кількість користувачів Semantic Scholar досягла семи мільйонів на місяць.[8]

Див. також

[ред. | ред. код]
  • Citation analysis – Examination of the frequency, patterns, and graphs of citations in documents
  • Citation index — Index of citations between publications
  • Knowledge extraction — Creation of knowledge from structured and unstructured sources
  • List of academic databases and search engines
  • Scientometrics — Study of measuring and analysing science, technology and innovation

Примітки

[ред. | ред. код]
  1. Jones, Nicola (2015). Artificial-intelligence institute launches free science search engine. Nature. doi:10.1038/nature.2015.18703. ISSN 1476-4687.
_2-0">↑ https://www.alexa.com/siteinfo/semanticscholar.org
  • Eunjung Cha, Ariana (3 листопада 2015). Paul Allen's AI research group unveils program that aims to shake up how we search scientific knowledge. Give it a try. The Washington Post. Архів оригіналу за 6 November 2019. Процитовано 3 листопада 2015.
  • а б Hao, Karen (18 листопада 2020). An AI helps you summarize the latest in AI. MIT Technology Review (англ.). Процитовано 16 лютого 2021.
  • Semantic Scholar Research. research.semanticscholar.org. Процитовано 22 листопада 2021.
  • а б в Fricke, Suzanne (12 січня 2018). Semantic Scholar. Journal of the Medical Library Association (англ.). 106 (1): 145—147. doi:10.5195/jmla.2018.280. ISSN 1558-9439.
  • Matthews, David (1 вересня 2021). Drowning in the literature? These smart software tools can help. Nature. Процитовано 5 вересня 2022. ...the publicly available corpus compiled by Semantic Scholar — a tool set up in 2015 by the Allen Institute for Artificial Intelligence in Seattle, Washington — amounting to around 200 million articles, including preprints.
  • а б Grad, Peter (24 листопада 2020). AI tool summarizes lengthy papers in a sentence. Tech Xplore (англ.). Процитовано 16 лютого 2021.
  • Allen Institute's Semantic Scholar now searches across 175 million academic papers. VentureBeat (амер.). 23 жовтня 2019. Процитовано 16 лютого 2021.
  • Bohannon, John (11 листопада 2016). A computer program just ranked the most influential brain scientists of the modern era. Science. doi:10.1126/science.aal0371. Архів оригіналу за 29 квітня 2020. Процитовано 12 листопада 2016.
  • Divvala S. PDFFigures 2.0: Mining figures from research papers — 2016.
  • Semantic Scholar. International Journal of Language and Literary Studies. Процитовано 9 листопада 2021.
  • Baykoucheva, Svetla (2021). Driving Science Information Discovery in the Digital Age (англ.). Chandos Publishing. с. 91. ISBN 978-0-12-823724-3.
  • Jose, Joemon M.; Yilmaz, Emine; Magalhães, João; Castells, Pablo; Ferro, Nicola; Silva, Mário J.; Martins, Flávio (2020). Advances in Information Retrieval: 42nd European Conference on IR Research, ECIR 2020, Lisbon, Portugal, April 14–17, 2020, Proceedings, Part I (англ.). Cham, Switzerland: Springer Nature. с. 254. ISBN 978-3-030-45438-8.
  • а б в Hannousse, Abdelhakim (2021). Searching relevant papers for software engineering secondary studies: Semantic Scholar coverage and identification role. IET Software (англ.). 15 (1): 126—146. doi:10.1049/sfw2.12011. ISSN 1751-8814.
  • AI2 scales up Semantic Scholar search engine to encompass biomedical research. GeekWire (амер.). 17 жовтня 2017. Архів оригіналу за 19 січня 2018. Процитовано 18 січня 2018.
  • Tech Moves: Allen Instititue Hires Amazon Alexa Machine Learning Leader; Microsoft Chairman Takes on New Investor Role; and More. GeekWire. 2 травня 2018. Архів оригіналу за 10 травня 2018. Процитовано 9 травня 2018.
  • Semantic Scholar. Semantic Scholar. Архів оригіналу за 11 August 2019. Процитовано 11 серпня 2019.
  • AI2 joins forces with Microsoft Research to upgrade search tools for scientific studies. GeekWire. 5 грудня 2018. Архів оригіналу за 25 серпня 2019. Процитовано 25 серпня 2019.
  • The University of Chicago Press joins more than 500 publishers working with Semantic Scholar to improve search and discoverability. RCNi Company Limited (англ.). Процитовано 22 листопада 2021.
  • Dunn, Adriana (14 грудня 2020). Semantic Scholar Adds 25 Million Scientific Papers in 2020 Through New Publisher Partnerships (PDF). Semantic Scholar. Процитовано 22 листопада 2021.
  • Посилання

    [ред. | ред. код]