Публикации по теме 'editors-pick'
Мы провели один раунд конкурса по науке о данных, и это произошло!
Простые и сложные модели для прогнозирования массы рыбы
Автор: Эдвард Крюгер и Дуглас Франклин .
В этой статье речь пойдет о конкурсе по науке о данных, который мы провели с одним из наших классов. Мы обсудим пять моделей с лучшими показателями и их сложность.
Вступление
Задача состоит в том, чтобы создать модель машинного обучения, которая предсказывает вес рыбы. Студент, модель которого имеет наименьшую среднеквадратичную ошибку (MSE), будет объявлен победителем!..
Кластеризация на основе плотности: DBSCAN против HDBSCAN
Какой алгоритм выбрать для ваших данных
Введение
Кластерный анализ — это соответствующая область науки о данных, которая позволяет группировать похожие объекты в отдельные подгруппы. Хотя существуют разные семейства алгоритмов кластеризации, наиболее широко известным является K-Means . Это алгоритм на основе центроида, означающий, что объекты в данных группируются путем присвоения ближайшему центроиду. Однако основная ошибка K-Means заключается в том, что он не обнаруживает..
Последние подборки: 8 распространенных ошибок при проведении A/B-тестов
Последние выборы:
8 распространенных ошибок при выполнении A/B-тестов , Лейхуа Йе, доктор философии. Исследователь Создание синтетических данных временных рядов , Александр Ватсон Препятствие больших данных , Джошуа Шимановски Создание змеиного масла с искусственным интеллектом , автор Аднан Хайдер
Если вы пропустили их:
Фотофиниш: создание ИИ дома , автор Streicher Louw Разработка компонента streamlit-webrtc для обработки видео в реальном времени , Юитиро..
Визуализация тегов части речи с помощью NLTK и SpaCy
Настройка визуализатора сущностей displaCy
В этом уроке мы разработаем функцию для визуализации тегов части речи (POS) с помощью NLTK и SpaCy .
Полученная функция превратит это
в это:
Мотивация
Теги POS – это метод, используемый при обработке естественного языка. Он классифицирует токены в тексте как существительные, глаголы, прилагательные и так далее. В Python для этой цели можно использовать библиотеку NLTK .
import nltk
from nltk import word_tokenize
text =..
Новые материалы
Конфигурация Gulp для WordPress - Часть II
Здесь мы переходим ко второй части руководства по настройке Gulp для оптимальной разработки WordPress. Если вы пропустили первую часть, где мы установили все модули, необходимые для задач,..
LACTF — сеть/метавселенная
В lactf я смог решить задачу веб/метавселенной.
Ниже приведен исходный код, предоставленный здесь
Из исходного кода видно, что флаг — это отображаемое имя администратора...
GraphQL — Язык запросов — Часть 1
Первое, что нужно знать: GraphQL — это спецификация (как она должна работать и выглядеть), а не реализация. GraphQL не нужно устанавливать, вы реализуете его с помощью серверной библиотеки,..
Будущее машинного обучения в Индии
Будучи связанным с интенсивно развивающимся языком, непрерывные технологические достижения наверняка поразят сектор машинного обучения, который вот-вот сформирует долгосрочную перспективу машинного..
Сравнение Clojure IDE — Emacs/Cider и IDEA/Cursive
Введение
Недавно я редактировал сообщение в блоге, в котором брал интервью у жителей Метосинии относительно их любимых редакторов Clojure . Было довольно интересно увидеть, что используется..
Строки, регулярные выражения и шаблонные литералы — Часть 1 | Понимание ES6
Строки, несомненно, являются одним из самых важных типов данных в любом языке программирования.
Строки есть практически в каждом языке программирования, и научиться их эффективному..
7 признаков того, что вы все еще начинающий веб-разработчик
В этой статье я расскажу о 7 признаках того, что вы все еще начинающий веб-разработчик. Это вещи, в которые время от времени могут впадать даже опытные разработчики, поэтому не беспокойтесь,..