Skip to content
View OscarFraile's full-sized avatar

Block or report OscarFraile

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Maximum 250 characters. Please don’t include any personal information such as legal names or email addresses. Markdown is supported. This note will only be visible to you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
OscarFraile/README.md

Hey there, I'm Oscar 👋

About me

  • 🔍 Data Scientist · ML · DL · GenAI · Transformando datos en decisiones
  • ☎️ Contact me
    LinkedIn Gmail whatsapp

🛠️ Skills & Certifications

Languages

Python  SQL 

Database

MySQL  SQlite 

Data Analytics & Machine Learning

Numpy  Pandas  Matplotlib  Seaborn  Folium  SQLAlchemy  SciPy  scikit-learn  XGBoost  LightGBM  Optuna  DALEX 

Deep Learning & NLP

BERT  HuggingFace  Transformers 

Generative AI & RAG

LangChain  LangGraph  ChromaDB  Gemini  Streamlit 

Certifications

Google Cloud Certification

📊 Projects

Airbnb Madrid — Predicción de Rentabilidad

Airbnb Madrid

Modelo XGBoost sobre 30.000 alojamientos de Airbnb en Madrid para predecir rentabilidad alta o baja. Pipeline end-to-end con calidad de datos, balanceo y GridSearch. Resultados visualizados en mapa interactivo por barrios. AUC-ROC 0.997.

Banking Risk — PD, EAD y LGD

Banking Risk

Sistema de scoring crediticio con tres modelos según el marco regulatorio Basilea II/III: Probabilidad de Default (clasificación), Exposición y Pérdida dado el Default (regresión). AUC-ROC PD 0.881.

Lead Scoring — Probabilidad de Compra

Lead Scoring

Segmentación KMeans (5 clusters) + clasificación XGBoost para predecir la probabilidad de compra de cada lead. Sistema listo para producción con código de reentrenamiento y ejecución. AUC-ROC 0.901.

Retail Forecasting — Ventas por Producto

Retail Forecasting

20 modelos individuales (producto × tienda) sobre datos M5 Kaggle para predecir ventas diarias. Pipeline escalable con HistGradientBoosting y RandomizedSearchCV. Código de producción incluido.

Online Retail — Predicción de Recompra

Online Retail Rebuying

Modelo sobre 1M+ transacciones para predecir qué clientes van a volver. RFM features + KMeans (4 segmentos) + HistGradientBoosting con Optuna. Explicabilidad con DALEX. AUC-ROC 0.864 · 2x lift.

Wise Trustpilot — Análisis con BERT

Wise Trustpilot BERT

Análisis de sentimiento y topic modeling sobre 5.800 reseñas Trustpilot con BERT. Wise.com comparado contra 69 competidores del sector Money & Insurance. Puesto 53/70 — 12 puntos bajo la media del sector.

Agente RAG — Experto en Motores

Agente RAG Motores

Agente conversacional RAG sobre 158 páginas de documentación técnica de motores de combustión. LangGraph + ChromaDB + Gemini con failover automático entre modelos y memoria conversacional. Interfaz Streamlit.

¿Analizamos algo juntos?

Contacto LinkedIn

Si tienes un problema de negocio que los datos pueden resolver, hablamos.

Popular repositories Loading

  1. lead-scoring lead-scoring Public

    Segmentación KMeans + clasificación XGBoost para predecir probabilidad de compra por lead. AUC-ROC 0.901.

    Jupyter Notebook

  2. OscarFraile OscarFraile Public

  3. retail-forecasting retail-forecasting Public

    Forecasting de ventas diarias para 20 combinaciones producto-tienda sobre datos M5 Kaggle. Pipeline escalable a producción.

    Jupyter Notebook

  4. banking-risk banking-risk Public

    Sistema de scoring crediticio con tres modelos (PD, EAD, LGD) según marco Basilea II/III. AUC-ROC PD 0.881.

    Jupyter Notebook

  5. Proyecto-Master-DataScience-Evolve-OscarFraile Proyecto-Master-DataScience-Evolve-OscarFraile Public

    Predicción de rentabilidad de alojamientos Airbnb en Madrid con XGBoost y mapa interactivo por barrios. AUC-ROC 0.997.

    Jupyter Notebook

  6. agente-rag-motores agente-rag-motores Public

    Agente RAG conversacional sobre documentación técnica de motores de combustión interna. Stack: LangGraph · ChromaDB · Google Gemini · HuggingFace Embeddings · Streamlit.

    Jupyter Notebook