О себе
Сергей Михель
Младший специалист по машинному обучению и разработке (Junior ML Engineer / Junior Data Scientist)
Цель:
Получение первой коммерческой позиции в области машинного обучения и анализа данных. Интересуюсь построением прогнозных моделей, очисткой данных и внедрением простых ML-решений в продукт. Готов быстро учиться и работать в команде.
Навыки:
· Языки программирования: Python (продвинутый), SQL (средний), базовые R, C++.
· Библиотеки Python: Pandas, NumPy, Scikit-learn, Matplotlib, Seaborn, Plotly; основы TensorFlow и PyTorch.
· Машинное обучение: линейная и логистическая регрессия, деревья решений, случайный лес, кластеризация (KMeans, DBSCAN), градиентный бустинг (легкие модели).
· Анализ данных: EDA, feature engineering, обработка пропусков и выбросов, визуализация, проверка гипотез.
· Инструменты и технологии: Git, Docker, Jupyter, VS Code, Linux, основы Airflow и MLflow.
· Метрики и валидация: кросс-валидация, метрики классификации/регрессии (accuracy, precision, recall, F1, MSE, MAE, R²), подбор гиперпараметров (GridSearch, RandomSearch).
· Базы данных: PostgreSQL, SQLite – написание сложных запросов, соединения, оконные функции.
· Soft skills: внимательность к деталям, умение структурировать информацию, способность объяснять результаты нетехническим коллегам.
Опыт работы / проекты (в т.ч. учебные и личные):
· Прогнозирование оттока клиентов (Telecom) – очистил данные (300 тыс. записей), провел EDA, обучил RandomForestClassifier с ROC-AUC 0,85. Разработал дашборд в Plotly для мониторинга признаков.
· Кластеризация товаров интернет-магазина – применил KMeans и PCA для сокращения размерности, выделил 5 групп товаров для персонализации рекомендаций. Использовал Docker для воспроизводимости.
· Система предсказания цен на жильё – обучил линейную регрессию и градиентный бустинг (CatBoost), сравнение моделей по MAE и R², деплой простого FastAPI-сервиса с моделью (Docker + pytest).
· Стажировка (учебная) в IT-лаборатории – написал ETL-пайплайн на Pandas и Airflow для еженедельной выгрузки метрик в базу данных.
Языки:
· Русский – родной
· Английский C1 читаю техническую документацию, могу вести переписку.
Дополнительно:
· Участвовал в хакатоне по Data Science (IBM Challenge 2024) – задача прогнозирования временных рядов, топ-15%.
· Веду технический блог с разборами алгоритмов.
· Готов к переезду/релокации (в рамках РФ)
Хобби / увлечения
Сергей Михель увлекается всем, что связано с данными и алгоритмами:
· Участвует в Kaggle-соревнованиях — для Сергея Михеля это лучший способ прокачать интуицию в ML.
· Пишет собственные pet-проекты (например, телеграм-бот для анализа текста) — Сергей Михель считает это полезным и расслабляющим.
· Играет в шахматы и головоломки (своим аналитическим мышлением Сергей Михель обязан именно им).
· Читает научно-популярные книги по статистике и ИИ — без этого Сергей Михель не чувствует профессионального роста.
· На выходных — настольный теннис и велопрогулки, чтобы разгрузить голову после кода.