Spark in me - Internet, data science, math, deep learning, philo

snakers4 @ telegram, 1166 members, 1154 posts since 2016

All this - lost like tears in rain.

Internet, data science, math, deep learning, philosophy.
No bullshit.

На чай
- goo.gl/zveIOr
- Договор ТКС 5011673505

Сайт spark-in.me
Файл goo.gl/5VGU5A
Чат goo.gl/IS6Kzz

Posts by tag «digest»:

snakers4 (Alexander), December 11, 10:01

Интересное в мире интернета:

Безумный мир

- Супер тонкий тролль вывел свой сарай в топ ресторанов trip advisor в Лондоне- goo.gl/7EqDaV

- 52 безумных факта в 2017 году - goo.gl/581Nmz

Интернет, IT

- Ben Evans - goo.gl/r2rwxe

- Apple скорее всего покупает shazam - goo.gl/1ZQ2zB

- Инстаграм тестирует мессенджер - goo.gl/72NGFL

- Guardian выходит на точку безубыточности - goo.gl/3PuqLf

- Гугл запускает с пяток India first продуктов - поиск, оптимизации ОС, телефон, платежную систему - goo.gl/V37HtC

- Как работают бизнес процессы модерации в крупных компаниях - goo.gl/Mfd9A5

Дивайсы

- Аналог интернет камеры за 20-30 баксов - goo.gl/Ztxm7s

- Adoption новых айфонов - внезапно очень быстро растет - goo.gl/QXEaYK

#internet

#digest

I Made My Shed the Top Rated Restaurant On TripAdvisor

And then served customers Iceland ready meals on its opening night.


snakers4 (Alexander), December 11, 09:33

52 безумных факта в 2017 году связанных с интернетом и технологиями.

- goo.gl/581Nmz

Несколько самых забавных

-- A fifth of all the Google searches handled via the mobile app and Android devices are voice searches

-- In 1990, more than a third of people on Earth lived on less than $1.90 a day, adjusted for local prices. By 2013, barely 10 percent of people did.

-- In Silicon Valley, startups that result in a successful exit have an average founding age of 47 years

-- A cryptocurrency mining company called Genesis Mining is growing so fast that they rent Boeing 747s to ship graphics cards to their Bitcoin mines in Iceland.

-- Beggars in China have sophisticated ways to collect payment; using QR Codes, WeChat accounts and in one case a Point Of Sale machine to collect donations.

#digest

52 things I learned in 2017

Between projects at Fluxx, and editing a book, I learned several learnings.


snakers4 (Alexander), December 08, 07:31

Интересное в мире ML / Deep Learning

Как обычно пропускаю через себя много мусора, чтобы найти что-то ценное =)

"Книги"

- Еще одна "книга" - записки ML специалиста - goo.gl/Wmes7p

Python

- Если хотите быстро понять в чем разница между hdf5 и bcolz вам сюда - goo.gl/wfcCri

Reading and writing data to a bcolz.carray is typically a lot faster than HDF5- Есть еще pytables - но я читал, что он более монструозный. Вообще такие штуки нужны если у вас есть массивы на сотни миллионов - миллиарды строк и вы хотите быстро оттуда читать

- Прослойка, чтобы работать с датафреймами на GPU - goo.gl/r8KPGd - если вы в курсе зачем и как - поделитесь опытом в чате ( GPU Dataframe of GPU Open Analytics Initialive (GOAI) )

Deep learning

- Сетки работают т.к. в мире физики доминируют относительно простые функции - goo.gl/JmTA2Y

- Adversarial example для вашего мозга - попробуйте понять что это - goo.gl/PGdX5m

- Фреймворки - новый способ доминирования на рынке ML - goo.gl/ZtMJVF (почему интерфейсы TF такое говно тогда? =) )

- PR кривые в тензорборд - может кому надо - goo.gl/5gM6a1

- Новая статья на Хабре про интуиции нейросетей - goo.gl/fwxcrC

- Безумие - но из попиксельных карт теперь можно создавать улицы в 2К разрешении

-- goo.gl/hoCA4C

-- www.youtube.com/watch?v=3AIpPlzM_qs

-- генератор goo.gl/myMXTQ

-- дискриминатор goo.gl/oki5rq

- Нашумевший StarGan - goo.gl/Gsvuoe

Machine learning / data science

- Внезапно гугл применил свой алгоритм для Го для шахмат - goo.gl/jwTtwb

- Новая статья на Distill - goo.gl/uLXJMr - про artificial intelligence augmentation (AIA): the use of AI systems to help develop new methods for intelligence augmentation - внезапно они тоже нарисовали списрального кота - goo.gl/4KJemD

- Фейсбук и алгоритмы предсказания суицидов - goo.gl/tsZvfH

- Статья от авторов LightGBM - goo.gl/NQFxai

Датасеты

- Мозилла открывает модель и очень много данных по распознаванию голоса

-- данные - voice.mozilla.org/data

-- модель - github.com/mozilla/DeepSpeech

Железо

- Nvidia Titan V - пускайте слюни за US$3k - www.youtube.com/watch?time_continue=43&v=NPrfiOldKf8

#digest

#data_science

#deep_learning

snakers4 (Alexander), December 05, 05:13

Интересное в мире интернета

- Ben Evans - goo.gl/HYMvh4

- Чуваки которые хотели отсудить Фейсбук имеют US$1bn в битках - goo.gl/EQcu6U

- Цены на Li-ion батареи продолжают падать линейно - goo.gl/TTyBVV

- Cydia закрывается - goo.gl/ik8STV - Apple победил. В ведерке вы можете ставить внешние говно-приложения на свой страх и риск просто нажав галку в меню. Про извращения, которые вы можете сделать подключившись со своего телефона к нему же в консоли вообще молчу

- Tunnel vision в Твиттере - goo.gl/NTG5ua - полярные мнения не пересекаются. Это разные миры. Еще один повод не участвовать в политике и тупых срачах

- В Кении к интернету доступ есть у 53% людей, 99% с мобилки - goo.gl/8P7D9H

- Cringe и маразм западного мира - Facebook for kids - goo.gl/smcyyL . Бред состоит в том, что буквально 50 лет в некоторых штатах назад даже в США дети рассматривались как бесплатная рабочая сила (а что семьи большие, пусть работают). А сейчас прививается этот маразм, что детство "нельзя трогать". Особенно это смешно, вспоминая школьные классы которые состояли от 5% до 50% из гопников (чем дальше тем их было меньше)

- Инфографика про посылки через интернет - Китай растет и уже на 2 месте после США - goo.gl/ZLDJVF

- Автономные машины могут помочь бедным - goo.gl/rjUDcp

- Кто в танке - рост битка и его сравнение с другими активами - goo.gl/WQ3kKY

- Uber занимался ... слежкой за людьми лол - goo.gl/GHW9qC

- Журналистота, но по гео-координатам можно находить факт наличия серийных убийц - goo.gl/FiVp93

- Как дети юзают интернет - goo.gl/BaZWxa

#internet

#digest

Winklevoss Twins Used Facebook Payout to Become Bitcoin Billionaires

In just four years.


snakers4 (Alexander), November 28, 13:58

Интересное в мире ML

- Еще одно, поверхностное, объяснения КапсНета - goo.gl/hYvZZV

- Датасет с 11к рук + метаданные - goo.gl/YVfPvi

- ONNX (типа единый формат для моделей) это уже часть Pytorch - pytorch.org/docs/master/onnx.html

- Nature запускает свой ML журнал - goo.gl/arzNg3

- Apple делает что-то с беспилотными авто - goo.gl/nMqzJ1

- Гугл снижает цены на топовые GPU прошлого поколения - goo.gl/4oM5wd

- Очень красивая но бесполезная практика с методами уменьшения размерности - goo.gl/UDgmUT

- Еще один алгоритм в копилку алгоритмов снижения размерности

-- PCA

-- T-SNE

-- UMAP - goo.gl/jFSBFZ

-- HDBscan - github.com/scikit-learn-contrib/hdbscan

- Fchollet про буллшит и general AI - goo.gl/zai717

" The intelligence of an octopus is specialized in the problem of being an octopus. The intelligence of a human is specialized in the problem of being human."

- Advisory Body про AI в UK - goo.gl/yZNBfD

- Офигенный пост про анализ комментов про отмену net neutrality - goo.gl/3ZahMM (!)

- Еще раз наткнулся на либу для NLP spacy - кто пробовал, норм? - spacy.io

#data_science

#digest

Capsule Networks (CapsNets) – Tutorial

CapsNets are a hot new architecture for neural networks, invented by Geoffrey Hinton, one of the godfathers of deep learning. NIPS 2017 Paper: * Dynamic Rout...


snakers4 (Alexander), November 21, 10:21

Интересное в мире ML

- Import AI - goo.gl/97JzTx

- Еще раз великолепная статья про визуализации нейросетей от Гугла - обязательно прочитайте - distill.pub/2017/feature-visualization/

- Канадские ученые - открытое письмо к правительство запретить использование AI в оружии - goo.gl/dixya1

- Еще один потенциальный вендор карт для нейросетей - goo.gl/dJ4CMJ

- Еще есть такая флешка (200 GFLOPs) - goo.gl/Usi1Qp

- Apple про свой детектор лиц на айфонах - goo.gl/1krh5H

- В tf пытаются встроить подобие PyTorch - goo.gl/eCYzU3

- Как правильно обращатсья с бейслайнами - goo.gl/ChgA1c

- Просто оставлю эту ссылку на форум тут - goo.gl/ZemhhL - огромный сборник best practice-ов для PyTorch

#digest

#data_science

Feature Visualization

How neural networks build up their understanding of images.


snakers4 (Alexander), November 21, 08:41

Интересное в мире интернета

- Ben Evans - goo.gl/JQg5rj

- Тесла представила новый авто...который вы получите в 2020 если заплатите сейчас - лол - goo.gl/TW2Y99

- Про грузовики Тесла от водителя грузовика - goo.gl/bCSf28

- Крипота в алгоритме people you may know фейсбука - goo.gl/58xDEs - причем вас могут вычислить даже если у вас в профиле нет ничего кроме имени

- В древности люди читали вслух - goo.gl/7UkxtQ

#digest

#internet

snakers4 (Alexander), November 18, 15:39

Интересное в мире ML

- Открылся конкурсе по распознаванию голоса - goo.gl/ojBHv7 - судя по всему там будет замес (прошло несколько дней, а там уже ажиотаж), но сам конкурс очень интересный

- Датасет с этого конкурса - goo.gl/CnDyGU

- Про инжиниринг фич - goo.gl/YvdBcZ

- Нейросетки для музыки - goo.gl/2baKrB

- LSTM для систем рекоммендаций - goo.gl/xPLDKn

- Прикольно про жанры музыки - похоже на то, как мы сами это делали - goo.gl/3QnfXG

- Бенчи сеток на TF по скорости работы. Кто инженер - налетай - github.com/taehoonlee/tensornets

- Как люди писали сетки 10 лет назад - goo.gl/4Biyom

- Плагин Chrome для archiv - fermatslibrary.com/librarian - по мне Менделей лучше

- Топовое решение с конкурса Carvana - github.com/asanakoy/kaggle_carvana_segmentation. Из важного:

-- Pytorch

-- Кастомные генераторы у всех участников

-- Сахар для работы с Tensorboard

-- Консольные скрипты с параметрами для запуска моделей

-- Копипаста - Юнет и подобные модели

#digest

#data_science

TensorFlow Speech Recognition Challenge

Can you build an algorithm that understands simple speech commands?


snakers4 (Alexander), November 14, 07:08

Интересное в мире интернета

- Instagram обгоняет snapchat - goo.gl/9r39H1

- И последний начинают покупать по частям понемногу - goo.gl/wPNo34

- Кто-то наконец написал стаью про дичь на Ютубе - goo.gl/8PsEgB - неразборчивые потребители + автоматическая генерация дичи + шаблонное SEO + отсутствие выгоды для Ютуба, чтобы банить и модерировать это все

- WeChat - 38 млрд сообщений в день, WhatsApp 50+, СМС в пике - 20+ - goo.gl/BE8G3N

- Еще раз обзор текущего рынка видеокарт и софта для работы с ними и с нейросетями - goo.gl/twhGLD

- Мысли про то, что нейросети это своебразный софт - goo.gl/GdWMtK - вот только про портативность там полный бред написан

- Обзор финансового состояния компании Tesla - goo.gl/WBrZfc

- Китайцы покупают соцсеть для караоке за 1 миллиард долларов? - goo.gl/F411kS

- Apple работает на VR headset - goo.gl/1x2teH

- Онлайн MMORPG second life (симс в онлайне) до сих пор имеет 600к юзеров - goo.gl/W3wxSA

#digest

#internet

Snap CEO Evan Spiegel is redesigning Snapchat because it’s too hard to use

This is a big deal.


snakers4 (Alexander), November 10, 06:44

Интересное в мире ML:

- Import AI - goo.gl/RwZRzQ

- Гугл продолжает развивать свой auto-ml. Безумие конечно, но они уже сделали это на Imagenet

-- goo.gl/Ng9d8f

-- goo.gl/oZX9td

- Еще раз отчет - the state of data science 2017 от Kaggle - goo.gl/oKjVtx

- Огромные инвестиции в распознавание лиц от России и Китая - goo.gl/qL5SWQ

- Это безумие, но фейсбук научился переводить с одного языка на другой вообще без размеченных текстов сразу на 2 языках - goo.gl/NgLcJE

- Ian GoodFellow про фейковые новости - goo.gl/ihBhgm

- Еще раз про капсульные сетки - hackernoon.com/what-is-a-capsnet-or-capsule-network-2bfbe48769cc

#data_science

#deep_learning

#digest

Import AI: #67: Inspecting AI with RNNVis; Facebook invents counter-intuitive language translation method; and what fractals have to do with neural architecture search

All hail the AI inspectors: New ‘RNNVis’ software makes it easier to interpret the inner workings of recurrent nets. …Figuring out why a particular neural network is classifying s…


snakers4 (Alexander), November 07, 10:58

Интересное в мире интернета

- Ben Evans - goo.gl/RM9h1U

- 60M юзеров ФБ фейки, 200M дубликаты - goo.gl/MGnefT

- Что люди фоткают на камеры смартфонов - goo.gl/xmMU1b

- Человек сделал пару простых бенчмарков с представлением adver

- Гугл планирует активно продвигать TF в Китае - goo.gl/CdYVwm

- Как Apple считает смайлики в своих телефонах - goo.gl/vdjGUg

#digest

#internet

snakers4 (Alexander), November 05, 04:03

Интересное в мире ML:

- Опрос - the state of ML от Каггла - www.kaggle.com/surveys/2017 . 2 графика наглядно иллюстрируют почему у нас зачастую ищут разрабов с налетом работы с данными, а не наоборот (понятно что у нас никто не отвечает на опросы, умножьте цифру в голове на 2)

-- goo.gl/8MU62f

-- goo.gl/8M3eAs

- Люди начинают делать аггрегаторы пре-тренированных моделей - этот pretrained.ml - судя по всему не работает. Качаем из доки своего любимого фреймворка пока...

- Якобы прорыв в архитектуре сетей - goo.gl/UvtrBj - arxiv.org/pdf/1710.09829.pdf - goo.gl/x6dhQJ - но пока только на MNIST

- Nvidia тренирует GAN прогрессивно на растущем разрешении и это якобы быстрее - arxiv.org/pdf/1710.10196.pdf

- Многобукв про то, что через годик появится много чипов для ML с 10x производительностью при таком же потреблении энергии - goo.gl/U7JTNF

- Uber открывает свой фреймворк для байесовых моделей - goo.gl/jWxFSj

- Популярная статья про adversarial аттаки на сети - goo.gl/2qMPHT и по сути самый важный код умещается на половину страницы

#digest

#data_science

#deep_learning

The State of ML and Data Science 2017

A big picture view of the state of data science and machine learning that shares who is working with data, what’s happening at the cutting edge of machine learning across industries, and how new data scientists can best break into the field.


snakers4 (Alexander), November 01, 13:10

Интересное в мире Интернета:

- Ben Evans - goo.gl/aG6TgQ

- Kinect больше не производят - goo.gl/bFgswT

- Твиттер будет помечать политическую рекламу - goo.gl/DtYWeN

- Доля бесконтактных платежей в США - 5% UK 45% - goo.gl/wzvCmS

- Deep Map + Ford - goo.gl/j8wCvt

- Внутренняя история вокруг снепчата - goo.gl/3UX3Bu

- VC пишут про ICO - goo.gl/cZEdpc - мол риски и опасность

- Guardian заработал 140 миллионов фунтов с помощью "призывов задонатить" в конце статей при этом не закрывая контент - goo.gl/cZEdpc

- Ben Evans про фейсбук, моду и дух времени. Мол не фейсбук определяет мнения своим алгоритмом фида, а лишь курирует течения в обществе - goo.gl/yffqHS

#internet

#digest

snakers4 (Alexander), November 01, 06:55

Подборка статей с канала на тему "Статьи и заметки автора"

55 Заметка про TTA - snakers41.spark-in.me/1368, snakers41.spark-in.me/1369

56 Заметка про SELU - snakers41.spark-in.me/1375

57 Модели и датасеты для семантической классификации - snakers41.spark-in.me/1393

58 Статья автора про поиск работы - snakers41.spark-in.me/1395

59 Итог конкурса carvana - snakers41.spark-in.me/1401

60 Заметка про оптимальное использование железа для нейросетей - snakers41.spark-in.me/1422

61 Классические статьи про нейросети - Resnet - Inception - snakers41.spark-in.me/1465

62 Детальный ответ автора про последнее соревнование - spark-in.me/post/fish-object-detection-ssd-yolo

#digest

#data_science

Spark in me

Пара слов - заметка про TTA = test-time-augmentation. В современных нейросетях зачастую используются такие способы регуляризации для избежания оверфиттинга - Аугментации входных данных (повороты, изменение размера, изменения цветовой гаммы, зум, обрезка, итд) - Batch normalization - Нормализация входных данных TTA - это применение аугментаций при формировании предсказаний на самой последней стадии при тестировании на отложенной выборке. Грубо говоря, если мы учили нейросеть, показывая ей измененные и искаженные данные, то при предсказании можно попробовать показывать нейросети разные варианты одной и той же картинки и потом усреднять. Тут описывается применение такого подхода - http://benanne.github.io/2015/03/17/plankton.html #data_science


snakers4 (Alexander), October 26, 11:47

Интересное в мире ML:

- Состояние NLP в 2017 - goo.gl/EiFPxy

- Еще раз AlphaGo - goo.gl/9GB3ez

- Уже появляются либы для распределенного RL - goo.gl/Ef9qFK

- Народ инвестирует время в reproducibility исследований - goo.gl/7efexv

- Uber выпустил свой фреймворк для распределенного обучения сетей - goo.gl/6LQyKu

Железо

- В конце 2017 появятся чипы intel для нейросеток - goo.gl/U2w6P8

- Не до конца понял фишки, но вроде как это софтверная прокладка между софтом для нейросетей и любыми осями и железом - vertex.ai/blog/announcing-plaidml - интересно что потом с этим станет

Датасеты

- Google выпускает в паблик датасет AVA с человеческими действиями - goo.gl/Tv6i5y

#data_science

#digest

Word embeddings in 2017: Trends and future directions

This post gives an overview of the deficiencies of pre-trained word embeddings in 2017 and how recent approaches have tried to resolve them.


snakers4 (Alexander), October 25, 06:07

Интересное в мире интернета:

- Ben Evans - goo.gl/hYj6nT

- Глобальные тренды в AI - goo.gl/yp4dFJ - очень краткое возможностей summary sota алгоритмов

TLDR про RL

The learned agent performs much better than the hard-coded agent, but moves more jerkily and “randomly” and doesn’t know the law of reflection. Similarly, the reports of AlphaGo producing “unusual” Go moves are consistent with an agent that can do pattern-recognition over a broader space than humans can, but which doesn’t find the “laws” or “regularities” that humans do.

Perhaps, contrary to the stereotype that contrasts “mechanical” with “outside-the-box” thinking, reinforcement learners can “think outside the box” but can’t find the box?- Пост про новый AlphaGo - goo.gl/3JJ422

- Intel выпустит процессоры для нейросетей в конце 2017 - goo.gl/Gw3gHg

- Facebook включает монетизацию своих игр - goo.gl/pk73cT

- Нейросетка внутри Siri - goo.gl/WdK6dC

- Как работает портретный режим в Google Pixel - goo.gl/8HAkwp

- Байки про зп в долине - goo.gl/9EUJwd

#digest

#internet

snakers4 (Alexander), October 23, 03:29

Давно не делал подборки с канала. Сделаю несколько штук)

Интересные ссылки на тему DS / ML

68 Cheat sheet-ы Data wrangling - snakers41.spark-in.me/1219

69 Bokeh - замена D3.js но на питоне - snakers41.spark-in.me/1220

70 Новый курс от fast.ai - прикладная линейная алгебра - snakers41.spark-in.me/1224

71 Быстрый анализ потокового видео - snakers41.spark-in.me/1227

72 Sklearn cheat-sheet - snakers41.spark-in.me/1229

73 Советы от призеров на Kaggle snakers41.spark-in.me/1231

74 Интуиция при использовании t-SNE - snakers41.spark-in.me/1239

75 Бенчмарки либ для градиентного бустинга - snakers41.spark-in.me/1250

76 ROC и AUC простыми словами - snakers41.spark-in.me/1262

77 Еще прогресс бары на питоне - snakers41.spark-in.me/1269

78 Fast.ai открыли вторую серию курса про глубокое обучение - snakers41.spark-in.me/1270

79 Чит шиты - архитектуры нейросетей - snakers41.spark-in.me/1273

80 РАБОТАЮЩИЙ пример multi-curl - snakers41.spark-in.me/1274

81 Многопоточность в питоне - snakers41.spark-in.me/1276

82 Как эффективно загружать .npy массивы в память в питоне - snakers41.spark-in.me/1279

83 Туториалы по Keras + tf с примерами в ipynb - snakers41.spark-in.me/1278

84 Новый курс от Andrew Ng - snakers41.spark-in.me/1293

85 Разложения матриц fast.ai - snakers41.spark-in.me/1294

86 Дельные статьи с Хабра - snakers41.spark-in.me/1303

87 Музыкальные рекоммендации - snakers41.spark-in.me/1305

88 Визуализация в виде карты - snakers41.spark-in.me/1306

89 Классная презентация про ML в гугле - snakers41.spark-in.me/1309

90 Многопоточная работа с файлами в питоне в Keras - snakers41.spark-in.me/1313

91 Мобильные архитектуры нейросетей snakers41.spark-in.me/1316

#digest

#data_science

Spark in me

Пара сверх-полезных cheat-sheet-ов для "ковыряния" в данных на pandas - Часть раз https://goo.gl/NYkqWb - Часть два https://goo.gl/EXjGXu Полезно будет тем, кто только начинает такие "ковыряния". На мой взгляд тут сильно не хватает сводных таблиц. Про них можно прочитать тут: - In a nutshell - https://goo.gl/K1xucE - Ссылка http://pbpython.com/pandas-pivot-table-explained.html #data_science #cheat_sheet


Подборка - статьи и заметки автора

30 Переход на HTTPS - snakers41.spark-in.me/1109

31 The art of learning - snakers41.spark-in.me/1099

32 Как пользоваться каналом - snakers41.spark-in.me/1084

33 Про деплой и поддержку сервера - snakers41.spark-in.me/1074

34 Про бекапы - snakers41.spark-in.me/1069

35 Про бекенд нашего сайта - snakers41.spark-in.me/1046

36 Как пользоваться каналом - snakers41.spark-in.me/1084

37 Заметка про Гугл, Андроид, Эппл и машинное обучение - snakers41.spark-in.me/1085

39 Книга про самообразование - snakers41.spark-in.me/1099

40 Заметка про семантическое ядро - snakers41.spark-in.me/1102

41 Заметка про RTB - snakers41.spark-in.me/1110

42 Анализ рынка через сайтмапы - snakers41.spark-in.me/1127

43 SMTP шлюзы - spark-in.me/post/smtp-relay-outsiders-view-1

44 Сайтмапы - часть 3 snakers41.spark-in.me/1171

45 Сайтмапы - часть 2 snakers41.spark-in.me/1153

46 Анализ 1.5м фоток квартир - начало - snakers41.spark-in.me/1180

47 Визуализации нейросетей - фейл - snakers41.spark-in.me/1196

48 Визуализация звука в питоне - snakers41.spark-in.me/1197

50 Про глупость и способы ее исправить - snakers41.spark-in.me/1263

51 Установка софта для работы с GPU и нейросетями - snakers41.spark-in.me/1287

52 Работа с U-NET на практике - snakers41.spark-in.me/1307

53 Как тренировать сверточные нейросети в 10 раз быстрее - snakers41.spark-in.me/1319

54 Про трудовую миграцию - snakers41.spark-in.me/1328

#digest

#data_science

Spark in me

Итак, закончилась небольшая эпопея по переводу сайта на HTTPS. Надеюсь кому-то покажется интересным. Описал основные блоки, которые по идее должны быть применимы для любого веб-проекта. Что самое главное - все старые ссылки и все-все-все должно работать) TLDR - ставьте https сразу и не мучайтесь) - https://spark-in.me/post/spark-in-me-https #internet


Подборка - статьи про pytorch

Гайд раз - snakers41.spark-in.me/1362

Fast.ai и pytorch - snakers41.spark-in.me/1367

Цикл статей про SSD на pytorch - snakers41.spark-in.me/1435

Pytorch и докер -snakers41.spark-in.me/1438

Впечатления про pytorch - snakers41.spark-in.me/1442

Расширение классов Pytorch - snakers41.spark-in.me/1447

Аугментации на pytorch - snakers41.spark-in.me/1449

Pytorch - снижение lr по шагам - snakers41.spark-in.me/1457

Внутрянка tf и pytorch - snakers41.spark-in.me/1467

#digest

#deep_learning

#pytorch

Spark in me

Знакомый поделился классным гайдом по PyTorch, который объясняет в чем его фишка. Если вы не пользуетесь Keras и ищете на чем потренироваться - то вам как раз подойдет. https://habrahabr.ru/post/334380/ #data_science #neural_nets


Подборка - Докер

Как начать в докер - snakers41.spark-in.me/1365

Как начать в докер - уже серьезнее - snakers41.spark-in.me/1403

Бойлерплейты на докере для DS - snakers41.spark-in.me/1409

Pytorch и докер -snakers41.spark-in.me/1438

Докер и проброс ssh - snakers41.spark-in.me/1439

Как поднять себе окружение в докере с уровня железа

snakers41.spark-in.me/1461

#digest

#linux

Spark in me

Если вы хотите начать превращать свой локальный или удаленный зоопарк в более структурированный зоопарк, или избавиться от конфликтов софта и необходимости все иметь всегда в последней версии, то вот несколько хороших вводных точек про докер - Раз https://habrahabr.ru/post/337306/ - Два https://docs.docker.com/get-started/ #linux


snakers4 (Alexander), October 16, 13:34

Интересное в мире ML:

- Import AI goo.gl/AUxYsx

- Wild ML goo.gl/SSQQxC

- Amazon выпускает компилятор для ускорения работы фреймворков для глубокого обучения до 20% - goo.gl/G612Me

- Кому актуально - релиз TF 1.4.0 - goo.gl/XZ1N6B

- Alibaba инвестирует US$15bn за 3 года в передовые технологии (включая NLP и ML) - goo.gl/D5aG13

- AWS и Microsoft запускают новый фреймворк для глубокого обучения - goo.gl/gZGrNf - вроде как там граф вычислений тоже динамический

- Нейросетки раскрашивают старинные фото - goo.gl/GPqPwe

#digest

#data_science

snakers4 (Alexander), October 16, 04:56

Интересное в мире ML

- Import AI - goo.gl/JZvTkT

- Еще раз про "классную" интернет-цензуру в Китае - goo.gl/Qtp2An

- Было - тестовый деплой автономных машин в районе с пенсионерами - goo.gl/YL3eGF

- Pixel buds - наушники Google c переводом - goo.gl/irp8fH

- NLP тулза - точное определение языка с использованием 1МБ памяти - goo.gl/Tzjzkt (вероятно логистическая регрессия на большом корпусе текста)

- Про репозитории Гугла - goo.gl/yRvkGP

- Google открывает филиал своего AI-research отделения в Монтреале - goo.gl/YRzKgF

- Гугл деплоит свой WaveNet на мобильных устройствах - goo.gl/AKpfMv

- Как деплоить Squeeze-Net на Raspberry pi и иметь порядка 1 кадра в секунду с распознаванием - goo.gl/PWrXSh (не забывайте что Pi стоит 10-20 баксов)

- Размышления про predictive shipping и Amazon - goo.gl/QnrtrV

- ЦРУ имеет 137 мини-проекта в сфере ML - goo.gl/AtqWL4

- Гугл открыл подразделение Deep Mind посвященное этике - goo.gl/SMuh9Z

#digest

#data_science

#machine_learning

snakers4 (Alexander), October 11, 02:59

Интересное в мире интернета:

- Ben Evans - goo.gl/syu48H

- Гугл запускает пару носимых дивайсов - камеру и наушники с функцией перевода, оба заточены под ML goo.gl/aJGyVt goo.gl/Dyc2X3

- AOL закрыл свой мессенджер с 500к пользователей - goo.gl/izqAaF (напоминает судьбу аськи)

- Запуск первого автономного такси в "песочнице" в спальном районе для пенсионеров - goo.gl/xvV44J

- Китай пытается сделать интернет-цензуру "классным" местом для работы для молодых - goo.gl/eTCXFL

- Medium позиционирует свою бизнес модель как "сразу с подпиской и поэтому мотивирующую делать качественный контент" - goo.gl/YDgSSZ

___________________

- Про алгоритмический bias - goo.gl/uKgxcX

- Гугл деплоит свой Wavenet в своем мобильном помощнике - goo.gl/vjR4WC - и почитать про wavenet - goo.gl/vSjNvt

-- goo.gl/NvW4HS

___________________

#digest

#internet

snakers4 (Alexander), October 07, 15:18

Давно не читал новости. Накопилось.

Интересное в мире DS/ML:

Лол:

- Раскрашивалка аниме-скетчей - github.com/lllyasviel/style2paints - веб морда сейчас не работает

Датасеты:

- Датасет из 100к рентгеновских изображений - goo.gl/fxayXJ

Cофт:

- Заканчивается развитие Theano на версии 1.0 (поддержка какое-то время будет) - goo.gl/mVBU5F

- Несколько примеров исторических визуализаций данных - goo.gl/9bmxFR

Рынок в целом:

- Amazon использует 100к роботов на своих складах - goo.gl/TKwnYM

- UN открывает свой ML отдел - goo.gl/4mVSP6

- Take-two шлет cease and desist письма исследователям и компаниям, которые используют GTA 5 для тренировки нейросетей - goo.gl/NxY3Nt

Про железо:

- P100 GPU в облаке Гугла в бете - goo.gl/RdCe2v

- Краткий обзор рынка железа для ML и тренды - ark-invest.com/research/gpu-tpu-nvidia

-- Какой % карты Nvidia используется под тензоры - goo.gl/a2rVgn

-- Основные игроки на рынке железа для ML goo.gl/KeefWy

-- Совместимость фреймворков для ML и железа - goo.gl/BZH8XT

-- Рост эффективности карт Nvidia для нейросетей от поколения к поколению - goo.gl/z9Gav2

Про новые архитектуры и сетки:

- Замена max pooling goo.gl/u5VTJc на параметрический слой и код - github.com/singlasahil14/sortpool2d

#data_science

#digest

lllyasviel/style2paints

style2paints - sketch + style = paints :art:


snakers4 (Alexander), October 02, 10:32

Интересное в мире Интернета:

- Ben Evans - goo.gl/4UgqSu

- Ответ ФБ на баян с жидо-ненавистниками - goo.gl/9AdQQk

- Apple переводит еще часть поиска на Google - goo.gl/tCg7xQ

- Икеа купила Task Rabbit - goo.gl/VrK94s

- SEС запустила кибер юнит - goo.gl/BPB4xa

- Размышления про Google и мобилку - goo.gl/jxqxcw

- Баннеро-резка и большой брат внутри нового браузера Apple - goo.gl/fh5qPm ?

- В 2017 году twitter ... тестирует формат в 280 символов вместо 140...лол - goo.gl/A5eiQv

- Интел закрывает свой AR проект - goo.gl/udL1PF

- Slack и AI - goo.gl/jMhB5V

______________________________________________

- Датасет из 100к рентгеновских снимков грудной клетки - goo.gl/ARsM7K С РАЗМЕТКОЙ - если вы медик или делаете прикладные исследования в нейросетях в медицицине то вам сюда

______________________________________________

#digest

#internet

snakers4 (Alexander), September 21, 06:58

Интересное в мире ML

- goo.gl/srLer2 - размышления на тему "а как автоматически придумывать оптимальные алгоритмы оптимизации функций? - goo.gl/r7Mcbe - прыгайте сразу на "How to Learn the Optimizer" - goo.gl/dujgph

- Import AI - goo.gl/uGmjW9

- FB открывает новый исследовательский офис - newsroom.fb.com/news/2017/09/fair-montreal/

- Софт который ... помогает использовать симуляторы дальнобойщиков для тренировки нейросетей для управления грузовиками - goo.gl/XdHypw

- Датасет с рейтингами 10к книг - goo.gl/GQuvh5

- Гугл открывает API для кастомных визуализаций в TensorBoard - goo.gl/qejTfr

#data_science

#digest

snakers4 (Alexander), September 19, 06:48

Интересное в мире интернета

- Ben Evans - goo.gl/fJrYZ3

-- Новинки Apple - goo.gl/AmbfZN (вроде как в том числе GPU с поддержкой Deep Learning inference)

-- Баги таргетинга - в рекламе Facebook можно таргетировать ненавистников евреев - goo.gl/vYMNLa

-- MAU мессенджера FB - 1.3bn - goo.gl/m74aC5

-- Вследствие наличия Uber рынок медальонов на такси в NY упал - goo.gl/VvWbTG

-- Реконструкция 3D лиц из фото (!) - www.cs.nott.ac.uk/~psxasj/3dme/

-- Внезапно исследование журнала The Economist про ... как матери в UK ругаются на форумах - goo.gl/XRWUC6

#digest

#internet

snakers4 (Alexander), September 14, 07:12

Послушал / прочитал материалы к 8 (первый урок второй серии) уроку fast.ai.

Вот, что кажется интересным / полезным / применимым в ваккууме:

1.

Поиск научных статей

- Искать тут - www.arxiv-sanity.com

- Сохранять у себя на ПК и в облаке такой тулзой mendeley.com/

2.

Советы по сборке своего ПК для deep learning

- Раз goo.gl/3vdqUV

- Два - на рынке все больше консьюмерских NVME дисков

- Три - знакомый советует карточки серии ASUS x99e-WS

- Еще пара ссылок

spark-in.me/post/gpu-server-set-up-guide

snakers41.spark-in.me/1287

snakers41.spark-in.me/702

3.

Сравнение 2 и 3 питона

- goo.gl/rfK2SY

4.

Основные понятия и навыки в deep learning которыми надо владеть - goo.gl/Ak8Y68

Transfer learning - goo.gl/xWbAiN

Борьба с оверфиттингом - goo.gl/8E5fBx

5.

Преимущества pytorch

- goo.gl/5SxRfP

6.

Про art style transfer говорить много смысла нет (ибо - cv-blog.ru/?p=168), но наркоманскую картинку я сделал

- goo.gl/3o4HoA

#data_science

#neural_nets

#digest

#ne

Mendeley - Reference Management Software & Researcher Network

Mendeley is a free reference manager and an academic social network. Manage your research, showcase your work, connect and collaborate with over six million researchers worldwide.


Теперь вы также можете задонатить на развитие канала тут по номеру договора

- www.tinkoff.ru/cardtocard/

- 5011673505

Перевод денег с карты на карту

Мгновенные денежные переводы между любыми картами любых банков. Быстрый способ вернуть долг или пополнить баланс своей кредитной карты.


snakers4 (Alexander), September 02, 12:19

Для всех, кто недавно присоеденился к каналу, вот что у нас есть

- У нас есть сайт spark-in.me (авторы на сайт - welcome)

- Гайд как пользоваться нашим каналом - spark-in.me/post/how-to-use-channel

- У нас есть курируемый лист курсов в сфере ML тут goo.gl/5VGU5A и тут author.spark-in.me/course-list.html (там есть сортировка)

- Была еще email рассылка - но ее лень стало воскрешать

- На канале постоянно делаются подборки и помечаются тегом #digest

- На канале есть ряд тегов (см. статью выше)

Главная страница spark-in.me

Главная страница коллективного блога авторов spark-in.me


Подборка с канала на тему

"Математические и статистические иллюстрации"

==============================

Было:

1 Кост функции при градиентном спуске snakers41.spark-in.me/48

2 Простая регрессия snakers41.spark-in.me/61

3 Линии уровня кост функции при градиентном спуске snakers41.spark-in.me/63

4 Классификация snakers41.spark-in.me/96

5 Классификация snakers41.spark-in.me/98

6 Лего - цена набора и число деталей snakers41.spark-in.me/260

7 Перемножение матриц - иллюстрация snakers41.spark-in.me/314

8 Статистика из мира танков snakers41.spark-in.me/337

9 Распространение при заражении snakers41.spark-in.me/439

10 Лучшие в мире визуализации по математике - www.youtube.com/channel/UCYO_jab_esuFRV4b17AJtAw/videos

11 Классные визуализации про производные - snakers41.spark-in.me/861

12 Суть экспоненты - snakers41.spark-in.me/866

13 2-minute papers канал на Ютубе - snakers41.spark-in.me/931

14 Лайтовый, но крутой канал про машинное обучение - snakers41.spark-in.me/957

15 Число пи, зета функция Римана, теория чисел и все в одном месте - snakers41.spark-in.me/974

16 Простые математические визуализации snakers41.spark-in.me/1000

17 Пифагоровы числа - snakers41.spark-in.me/1006

18 Великолепная серия видео про комплексные числа и функции snakers41.spark-in.me/1031

19 Начало серии видео про мат. основы DS - snakers41.spark-in.me/1089

==============================

Новое

20 Площадь многоугольников - snakers41.spark-in.me/1063

21 Визуализация того как работают решающие деревья - snakers41.spark-in.me/1228

22 Mathologer про многомерные фигуры - snakers41.spark-in.me/1234

23 Интуиции по работе с многомерными пространствами - snakers41.spark-in.me/1299

24 Полностью онлайн книга по линейной алгебре - супер - snakers41.spark-in.me/1335

25 Как учиться быстрее - snakers41.spark-in.me/1351

==============================

#digest

Spark in me


snakers4 (Alexander), August 14, 06:57

Не читал рассылки с Хабра достаточно давно (т.к. 90% информации там - реклама или мусор). Выздоровев, решил разобрать почту. Вот, что накопал из непрочитанного за несколько месяцев.

Выписал интересные ссылки - может вам понравятся:

- Список книг про нейросети - goo.gl/voq6tM . Сам я читал эти книги (и рекоммендую их) - а еще они в свободном доступе:

-- deeplearningbook.org

-- neuralnetworksanddeeplearning.com

- Вменяемая статья про дедлоки в постгресе - goo.gl/ARpbJc

- Откуда берется расписания на Tutu.ru - goo.gl/HhhwAq - огромная работа

- Новые способы ускорения обучения нейросетей - goo.gl/zNUvD2

- Интересные функции Google Sheets, о которых я не знал - goo.gl/AGH4nh

- Пояснения про Dropout в нейросетях - goo.gl/1Fqa1n

- Если кто-то захочет поднять дашборд на питоне с bokeh - вот гайд - goo.gl/wmwXje - а так по идее и jupyter notebook хватает

#digest

#internet

#data_science

Что читать о нейросетях

Нейросети переживают второй Ренессанс. Сначала еще казалось, что сообщество, решив несколько прикладных задач, быстро переключится на другую модную тему.


Нашел еще один блог про state-of-the-art DS/AI/Deep Learning:

- blog.openai.com

Там можно подписаться на рассылку.

#data_science

OpenAI is a non-profit AI research company, discovering and enacting the path to safe artificial general intelligence.


snakers4 (Alexander), August 07, 04:23

Несколько раз в последнее время ставил тот же софт на ПК для работы с GPU. Плюс меня спрашивали как настраивать сервер для работы с нейросетями.

Поэтому список полезных ссылок на форумы, скриптов и файлов:

- Ссылка на посты про сборку сервера и установку драйверов GPU

-- snakers41.spark-in.me/702

-- snakers41.spark-in.me/149

- Скрипт для настройки сервера с GPU от fast.ai

(внимание, там theano, старая версия keras, дрова и cuda / cudnn лучше всегда ставить самому на своей машине)

-- resources.spark-in.me/gpu_deep_install.sh

- Софт, который использую я

-- resources.spark-in.me/vds_w_gpu.sh

Disclaimer

- Для исследования данных и отладки лучше использовать jupyter notebook

- Для запуска скриптов на несколько суток - лучше написать отдельный отлаженный .py скрипт, который не будет зависеть от вас, и повесить его на отдельную сессию tmux

И программа всех времен и народов для упрощения жизни - tmux

-- snakers41.spark-in.me/720

#data_science

#digest

Spark in me

Полезно, если вы играетесь с нейросетями и у вас дома уже есть сервер с видеокартой. - Форум http://forums.fast.ai/t/making-your-own-server/174 - Лучшие посты http://forums.fast.ai/t/making-your-own-server/174/184 http://forums.fast.ai/t/making-your-own-server/174/195 - Команда для консоли для установки (читать с долей скепсиса и сравнивать со своим уже текущим конфигом) https://github.com/fastai/courses/blob/master/setup/install-gpu.sh - Сравнение GPU http://timdettmers.com/2017/03/19/which-gpu-for-deep-learning/


snakers4 (Alexander), August 06, 05:11

Для тех, кто недавно присоеденился к каналу (сейчас я делаю пару итераций в паре проектов, все детально опишу в виде статей по итогу) - подборка статей и заметок с канала на тему:

"Длинные" статьи автора на темы которые хотелось покрыть, заметки из практики

Строчек много (и это не все), поэтому они разделены на то, что уже было в подборке и "новое"

(если вы уже читали, мотайте вниз).

Было:

1 Изучение языков - как и зачем spark-in.me/post/learning-languages

2 Изучить что-то новое и не стать лохом spark-in.me/post/learn-sth-new

3 Оптимизация кальных бизнес процессов spark-in.me/post/tedious-process-optimization

4 На пальцах как работает распознавание образов snakers41.spark-in.me/144

5 Сталкинг в соц-сетях spark-in.me/post/find-a-lurker

6 Работа маленькой командой на сервере без гимора spark-in.me/post/ubuntu-dev-server-for-dummies

7 Заметка про будущее моделей snakers41.spark-in.me/501

8 Заметка про open data day snakers41.spark-in.me/545

9 Заметка про обманщиков snakers41.spark-in.me/549

10 Заметка про Uber snakers41.spark-in.me/562

11 Заметка про jp notebook snakers41.spark-in.me/565

12 Заметка про графики в питоне snakers41.spark-in.me/566

13 Заметка про выбор тикет / таск менеджера snakers41.spark-in.me/568

14 Заметка про организацию бизнес-процессов snakers41.spark-in.me/571

15 Заметка про оптимизацию оффлайн рекламы snakers41.spark-in.me/587

16 Поиск работы в начале 2017 года в Москве spark-in.me/post/job-panopticum

17 Треш с которым вы можете столкнуться при покупке квартиры spark-in.me/post/flat-purchase-panopticum

18 Финансовый анализ ипотеки - spark-in.me/blog/mortgage-analyzed

19 Треш с которым вы можете столкнуться при покупке квартиры spark-in.me/post/flat-purchase-panopticum

20 Заметка про CPM в телеграме snakers41.spark-in.me/773

21 Анализ пайплайнов сделок - snakers41.spark-in.me/860

22 Заметка про attention span, CPM и конверсию snakers41.spark-in.me/865

23 Статья автора про онлайн платежные страницы snakers41.spark-in.me/917, snakers41.spark-in.me/951

24 Статья автора про карту артистов - snakers41.spark-in.me/978

25 Про интуицию, здравый смысл и простые байесовы модели на практике - snakers41.spark-in.me/1011

26 Spark-in.me - зачем и почему snakers41.spark-in.me/1015

27 Про разметку кур в нейрокурятнике - snakers41.spark-in.me/1038

29 Как научиться науке о данных не заплатив 150,000 рублей snakers41.spark-in.me/1029

"Новое"

30 Переход на HTTPS - snakers41.spark-in.me/1109

31 The art of learning - snakers41.spark-in.me/1099

32 Как пользоваться каналом - snakers41.spark-in.me/1084

33 Про деплой и поддержку сервера - snakers41.spark-in.me/1074

34 Про бекапы - snakers41.spark-in.me/1069

35 Про бекенд нашего сайта - snakers41.spark-in.me/1046

36 Как пользоваться каналом - snakers41.spark-in.me/1084

37 Заметка про Гугл, Андроид, Эппл и машинное обучение - snakers41.spark-in.me/1085

39 Книга про самообразование - snakers41.spark-in.me/1099

40 Заметка про семантическое ядро - snakers41.spark-in.me/1102

41 Заметка про RTB - snakers41.spark-in.me/1110

42 Анализ рынка через сайтмапы - snakers41.spark-in.me/1127

43 SMTP шлюзы - spark-in.me/post/smtp-relay-outsiders-view-1

44 Сайтмапы - часть 3 snakers41.spark-in.me/1171

45 Сайтмапы - часть 2 snakers41.spark-in.me/1153

46 Анализ 1.5м фоток квартир - начало - snakers41.spark-in.me/1180

47 Визуализации нейросетей - фейл - snakers41.spark-in.me/1196

48 Визуализация звука в питоне - snakers41.spark-in.me/1197

#digest

#data_science

Для тех, кто недавно присоеденился, как пользоваться каналом

spark-in.me/post/how-to-use-channel

Как пользоваться нашим каналом в телеграме

В статье описано как пользоваться каналом в телеграме Статьи автора - http://spark-in.me/author/snakers41 Блог - http://spark-in.me


snakers4 (Alexander), August 01, 06:36

Интересное в мире ML

- Import AI goo.gl/edj1qi

- Занятная статья про ImageNet и его роль - goo.gl/B2vGyy

-- За 10 лет точность выросла с 70+% до 95-97%

-- goo.gl/FrgAvJ

- Баян, но второй конкурс AI-гранта - goo.gl/2Lgsw6 - я послал своих птичек

- UK запускает конкурс с призом в US$23m на разработку систем автономных авто

- Соревнование Nexar-2 + 50,000 картинок из авторегистраторов - весьма прикольно и жизненно - goo.gl/LPkcsP

- Вы можете подарить свой голос Mozilla Foundation для их исследований - goo.gl/vk6aXq

- Китайцы выиграли конкурс WebVision - goo.gl/GdZ4V8

- Про AutoML от гугла - goo.gl/pv5cPy

#data_science

#digest