Telegram — лонгриды

Датасет Русской **капчи

29.01.2023

**Датасет Русской** **капчи **На сайте ФССП с недавнего времени была добавлена русская капча. Возникла идея разметить и выгрузить в виде датасета и опубликовать на kaggle и в этом канале. Публикую обновленную версию архива из 40 310 картинок, которые разбил на 4 категории: 4 символа на картинке - 6...

Читать далее
Почему шестиугольники?
Статьи

Почему шестиугольники?

27.06.2022

Агрегация случайных точечных данных в регулярные сетки используется по многим причинам, в частности для нормирования географии для нанесения на карту или для уменьшения неоднородности при использовании полигонов неправильной формы, созданных произвольно (например, границы избирательных округов или...

Читать далее
Подсчет количества файлов в папке в Linux
Статьи

Подсчет количества файлов в папке в Linux

17.05.2022

Вот несколько способов подсчитать количество файлов в каталоге в командной строке Linux. Мы предполагаем, что вы знаете о команде wc для подсчета количества строк. Мы можем использовать ту же команду wc с командой ls для подсчета количества файлов в каталоге. Эта задача кажется простой, но вскоре...

Читать далее
История науки о данных
Статьи

История науки о данных

29.04.2022

Существует много разных дат и временных рамок, которые можно использовать для отслеживания медленного роста науки о данных и ее текущего влияния на индустрию управления данными, некоторые из наиболее важных из них описаны ниже. В 1974 году Питер Наур написал «Краткий обзор компьютерных методов»,...

Читать далее
Статьи

Джон Тьюки

29.04.2022

Более 50 лет назад Джон Тьюки призвал к реформированию академической статистики. В «Будущем анализа данных» он указал на существование пока еще непризнанной науки, предметом интереса которой было обучение на основе данных или «анализ данных». Десять-двадцать лет назад Джон Чемберс, Билл Кливленд и...

Читать далее
Что такое Random Forest?
Статьи

Что такое Random Forest?

13.10.2021

При выборе модели машинного обучения нет доминирующего алгоритма. Некоторые лучше работают с большими наборами данных, а некоторые лучше работают с данными большого размера. Таким образом, важно оценить эффективность модели для вашего конкретного набора данных. В этом подразделе рассматривается...

Читать далее
Что такое глубокое обучение?
Статьи

Что такое глубокое обучение?

13.10.2021

Глубокое обучение относится к определенным типам машинного обучения, но точное определение найти сложно. Этот термин был придуман примерно в 2006 году, но различные формы изучались с тех пор, как машинное обучение возникло как область исследований [1]. Это часто связано с нейронными сетями, в...

Читать далее
Основные критерии подходов к машинному обучению
Статьи

Основные критерии подходов к машинному обучению

13.10.2021

Существует несколько основных категорий подходов к машинному обучению: Обучение с учителем: в обучении с учителем алгоритмы описывают взаимосвязь между входными переменными или векторами входных данных и наблюдаемыми результатами и применяют их к новым входным данным для прогнозирования результата....

Читать далее
Различия в методологиях моделирования машинного обучения
Статьи

Различия в методологиях моделирования машинного обучения

13.10.2021

Машинное обучение (ML) - это тип искусственного интеллекта, который упрощенно можно определить как: системы учатся на основе прошлого, чтобы предсказывать будущее [1]. Алгоритмы используются для «изучения» взаимосвязи между переменными данных. Другое определение гласит: «Алгоритм машинного обучения...

Читать далее
Список тем по дисциплине "Как надо работать над диссертацией"
Статьи

Список тем по дисциплине "Как надо работать над диссертацией"

08.10.2021

Методы работы с научной литературойОбщая композиция текста.Движение глаз при чтении.Условия успешности чтения.Приемы концентрированного вниманияПриемы овладения техникой чтенияТри вида просмотра научной литературыНедостатки традиционных методов чтенияСемь золотых правил быстрого чтенияВиды...

Читать далее
tmux команды и читы
Статьи

tmux команды и читы

07.10.2021

tmux shortcuts & cheatsheet Создать новый tmux: tmux Создать новую сессию tmux с названием: tmux new -s myname Присоединиться к сессии: tmux a # (или at, или attach) Присоединиться по имени: tmux a -t myname Показать список сессий: tmux ls Убить сессию: tmux kill-session -t myname Убить все сессии:...

Читать далее
Удаление неудаляемых программ
Статьи

Удаление неудаляемых программ

01.10.2021

Бывает не удаётся удалить программы через "Установку и удаление программ". Помогают uninstaller'ы, можно воспльзоваться geekuninstaller - программа для удаления неудаляемых программ, есть бесплатная лицензия для личного использования. Удаляет как классические программы, так и приложения из Windows...

Читать далее