布鲁诺·巴博萨·米兰达,开发商贝洛奥里藏特-米纳斯吉拉斯州,巴西
Bruno is available for hire
Hire Bruno

Bruno Barbosa Miranda

Verified Expert  in Engineering

数据科学家和Python开发人员

Location
贝洛奥里藏特-米纳斯吉拉斯州,巴西
Toptal Member Since
September 30, 2021

布鲁诺最初是一名医学博士,但他是第一个在他的国家的一所顶尖大学获得计算机科学硕士学位的人, 没有受过正规计算机科学教育. He is currently pursuing a Ph.D. 在同一所大学(UFMG)攻读计算机科学专业. 布鲁诺认为自己是一个非常积极和充满激情的专业人士,他热爱自己的工作,并不断学习新事物.

Portfolio

Shop For A Better World
Azure云服务,认知搜索,分类,虚拟机,LightGBM...
Pixelcut Inc.
机器学习,Python, TypeScript, PyTorch, SQL...
Faculdade Unimed
雪花,Docker, Python, SQL, NoSQL, Spark, Spark ML...

Experience

Availability

Part-time

Preferred Environment

Spyder, Windows 10, MacOS, Anaconda, TensorFlow, Scikit-learn, NumPy, Python 3, Amazon Web Services (AWS), LightGBM

The most amazing...

...当我实现自己的自定义深度强化学习算法时, 谁学会了独立玩电子游戏.

Work Experience

Senior ML Engineer

2023 - 2023
Shop For A Better World
  • 成功分类了超过180个数据库,多个类别中的000个企业生成元数据.
  • 为客户端的搜索引擎配置Azure认知搜索.
  • 创建了一个web抓取系统,该系统可以随着时间的推移自动更新数据库记录,同时删除从不同来源获得的重复实例并整合结果.
Technologies: Azure云服务,认知搜索,分类,虚拟机,LightGBM, Web Scraping, Deduplication, Database Management, Communication

AI/ML Engineer

2023 - 2023
Pixelcut Inc.
  • 利用计算机视觉神经网络估计基于镂空蒙版的软阴影, 在参考论文的基础上进行了改进.
  • 实现了多gpu训练与pytorch编译代码和多节点磁盘访问, 用我自己生成的超过10亿个合成图像样本进行训练.
  • 为使用FastAPI将模型部署到客户端应用程序生成代码.
  • 使用合成数据生成帮助开发了一个切模掩蔽模型.
Technologies: 机器学习,Python, TypeScript, PyTorch, SQL, Graphics Processing Unit (GPU), Google Cloud, Google Cloud ML, Google Cloud SQL, FastAPI, Deep Neural Networks, Algorithms, 3D Images, Image Generation, NVIDIA CUDA, Models, 通用人工智能(AGI), 生成对抗网络(GANs), Communication

数据科学专家顾问

2023 - 2023
Faculdade Unimed
  • 将关键软件组件的计算时间从三天减少到不到五分钟.
  • 帮助从头开始构建整个雪花架构,以托管用于住院分析的软件服务, similar to HRG and DRG.
  • 构建核心功能,使用Python和Snowpark处理整个住院分析算法.
Technologies: 雪花,Docker, Python, SQL, NoSQL, Spark, Spark ML, 机器学习操作(MLOps), Sentiment Analysis, Regression, MySQL, Leadership, Communication

Machine Learning Developer

2022 - 2023
Arthur Haliski De Andrade
  • 部署了一个基于遗传编程的遗传算法,该算法学习为交易生成自定义技术变量. 整个算法使用RAPIDS在GPU上运行.
  • 提供了一个混合强化学习神经网络算法,该算法使用PyTorch编写的神经网络学习交易金融市场.
  • 管理一个由三个程序员组成的团队,同时自己编写复杂的交易算法.
Technologies: Machine Learning, Python, Algorithms, Deep Neural Networks, Genetic Algorithms, Trading Systems, Mathematics, Algorithmic Trading, Quantitative Research, 机器学习操作(MLOps), NVIDIA CUDA, Financial Modeling, Regression, Backtesting Trading Strategies, Models, Leadership, Communication

Senior Data Scientist

2022 - 2023
Microsoft
  • 开发了一种基于光学字符识别(OCR)的电子邮件签名扩展方法.
  • 对恶意邮件进行聚类和分类.
  • 解决了微软服务上的许多新bug, 用数据科学和其他分析工具跟踪它们.
Technologies: Python, C#, Azure, Data Science, OCR, Algorithms, SQL, NVIDIA CUDA, Regression, MySQL, Models, 通用人工智能(AGI), Communication

NLP Expert

2022 - 2022
Prepaire Labs Limited
  • 开发了一个基于药物相互作用知识图谱的药物推荐系统, genes, proteins, and diseases.
  • 建立了一个药物嵌入系统,可以在没有标记数据的情况下聚类药物类别.
  • 构建大规模相互作用网络,预测不同实体之间的分子相互作用.
Technologies: Python, Bioinformatics, Machine Learning, GPT, 生成预训练变压器(GPT), 自然语言处理(NLP), Data Science, Natural Language Toolkit (NLTK), Biotechnology, 机器学习操作(MLOps), NVIDIA CUDA, Models, Leadership, Communication

Data Analyst | Statistician

2022 - 2022
Product Tranquility LLC
  • 帮助客户清理调查数据中不一致的数据点.
  • 结合机器学习和数据科学产生调查见解.
  • 再现经典的调查分析技术来分析定价.
技术:数据科学,线性回归,聚类,调查,调查开发 & 分析、互操作性、财务建模、模型、通信

Data Scientist

2022 - 2022
Alaris Acquisitions, LLC
  • 提供一个应用程序来估计买卖机构之间的相似性,使用Streamlit的前端演示.
  • 使用Amazon的AWS S3为应用程序的所有远程用户部署在线文件同步.
  • 创建了一个可定制的界面来输入和更改系统变量,使应用程序尽可能灵活,同时保持一致性和可扩展性.
Technologies: Algorithms, Streamlit, Python, Machine Learning, Finance, Data Mining, Data Modeling, Data Analytics, 生成预训练变压器(GPT), GPT, 自然语言处理(NLP), Pandas, JSON, Text Mining, Algorithmic Trading, Quantitative Research, Financial Modeling, Communication

高级数据科学家和机器学习工程师

2021 - 2022
Toptal Client
  • 为一个客户的企业开发并成功部署了一个定制推荐系统.
  • 积极致力于使用迁移学习从用户图像中自动生成元数据.
  • 为CS团队开发了一个客户流失检测模型,并集成了定制的电子邮件.
  • 积极研究基于条目和用户嵌入的语义搜索算法.
  • 开发PowerBI仪表板,向客户显示相关数据.
  • 使用MLflow和电子邮件api将我们的解决方案与现有架构集成.
  • 开发了一种基于正无标签问题框架的先导评分算法.
技术:Microsoft Power BI, Microsoft Azure, Databricks, Recommendation Systems, B2C Marketing, TensorFlow, Neural Networks, Analysis, Data Analysis, Apache Spark, Data Visualization, Statistics, Business Intelligence (BI), MLflow, Statistical Data Analysis, Analytics, Data Analytics, ETL, Atlassian, Jira, Database Analytics, Classification Algorithms, NumPy, Innovation, PySpark, Data Science, Jupyter Notebook, Data Engineering, Excel 365, Microsoft Excel, Predictive Modeling, Predictive Analytics, Data Mining, Data Modeling, Data Reporting, SQL, Python, Cloud, Deep Learning, GPT, 生成预训练变压器(GPT), 自然语言处理(NLP), Pandas, ETL Tools, JSON, Text Mining, Technical Hiring, Code Review, Task Analysis, Interviewing, Statistical Modeling, Azure, Bash, OCR, Sentiment Analysis, MySQL

Senior Data Scientist

2021 - 2021
Tecnium
  • 开发了当时最好的独特产品识别程序.
  • 教授队友神经网络方法, such as autoencoders, RankNet, transformers, and embedding spaces.
  • 创建了一个产品名称嵌入,使用变压器神经网络,可用于多个问题.
Technologies: Python 3, Microsoft Azure, Databricks, Machine Learning, Few-shot Learning, Rankings, Classification Algorithms, Azure Machine Learning, NumPy, Innovation, PySpark, Data Science, Jupyter Notebook, Data Engineering, Excel 365, Microsoft Excel, Predictive Analytics, Data Mining, Data Modeling, Data Reporting, SQL, Python, Cloud, Deep Learning, Analytics, 生成预训练变压器(GPT), GPT, 自然语言处理(NLP), Pandas, ETL Tools, JSON, Text Mining, Statistical Modeling, Azure, Bash, OCR, Google Cloud ML, Regression, MySQL

Senior Data Scientist

2019 - 2021
Unimed
  • 使用NLP、机器学习和变压器开发面向数据的模型.
  • 帮助我将目前的行业转变为数据科学导向的企业.
  • 使用嵌入和神经网络构建有用的度量和评分系统.
  • 创建并部署了一个网络爬虫,以生成与医疗保健相关的疾病代码数据集.
  • Proposed, implemented, 并部署了一种用于未来住院预测的算法和患者疾病数据的语义表示.
  • 在我参加的所有年度公司创新奖评选中,作为三名入围者之一, winning the 2021 prize.
  • 使用时间序列算法预测未来的医疗保健需求. 我使用了多个神经网络架构, 比如变分自动编码器, residual neural networks, 以及从医学图像中获取信息的视觉变压器.
Technologies: Python 3, TensorFlow, Machine Learning, Reinforcement Learning, GPT, 自然语言处理(NLP), 生成预训练变压器(GPT), Amazon Web Services (AWS), ARIMA, LightGBM, SVMs, Support Vector Machines (SVM), LSTM, LSTM Networks, Long Short-term Memory (LSTM), Artificial Intelligence (AI), 人工神经网络(ANN), MySQL, MySQLi, SQL, Presto, Big Data, 残余神经网络(ResNet), Vision Transformer (ViT), Classification Algorithms, Images, Health, Azure Machine Learning, NumPy, Innovation, Transformers, Data Science, Data Engineering, Excel 365, Microsoft Excel, Predictive Modeling, Predictive Analytics, Data Mining, Data Modeling, Data Reporting, Data Analytics, Amazon SageMaker, Image Processing, Computer Vision, Python, Cloud, Deep Learning, Analytics, Pandas, ETL Tools, Text Mining, Code Review, Task Analysis, Statistical Modeling, Bash, OCR, Oncology & 癌症治疗,情绪分析

Teacher

2018 - 2021
University of Medical Science
  • 利用在线技术开发了一个数字教学系统.
  • 教授学生使用机器学习和数据科学方法进行医学研究.
  • 监督研究项目和课程,重点关注最近的机器学习和一般技术趋势.
Technologies: Python 3, Data Science, Research, Classification Algorithms, NumPy, Innovation, Jupyter Notebook, Code Review, Oncology & Cancer Treatment

Project Cindy

辛迪是一个强化学习代理,学习如何根据价格交易股票, volume, and other relevant data. 我已经建立了一个模拟器,通过历史数据来训练代理,并将其应用于实时市场操作. 最初的版本在MetaTrader 5和我自己的Python API之间架起了一座桥梁.

在这个项目中,我测试了许多不同的强化学习技术,包括:
• Deep-Q learning agent (DQN)
•异步演员评论代理(A3C)
•同步演员评论代理(A2C)
•近端策略优化(PPO)
•卷积神经网络(CNN)

Instagram Bot

我已经创建了一个全自动的Instagram自动化解决方案作为涂鸦项目. 机器人将自动访问配置文件(网络爬行), 对比一下我的侧写, 估计它与用户交互并跟随用户的概率, the user will follow it back. 如果概率超过某个阈值, 机器人对一些帖子点赞和评论,然后关注目标用户. 使用这种策略,我的模拟帐户增长到2.大约一个月就有5000名粉丝,之后我就不再使用这个机器人了.

脑CT图像改变检测

In this doodle project, 我设置了一个自动编码器来学习正常脑部CT图像的重建, 将公共Kaggle数据集作为输入, 然后使用结果嵌入得到最先进的分类结果.

基于强化学习的自动标注

我在我的硕士学位上做过这个项目,并建立了一个强化学习代理,它基于一个小的标记数据集进行元学习. 代理选择数据块来使用其训练过的分类器和标签之一, 然后添加到标记集并重新训练其他分类器.

心电图自动分类

http://www.kaggle.com/competitions/dcc-week-challenge-2023/overview
在这次Kaggle的心电图自动分类比赛中,我从相对较小的12导联检查样本中学习,获得了第二名. 对于这个项目,我使用了一个自定义的神经网络解决方案.

Languages

Python 3, Python, SQL, c++, Bash, MQL5, c#, Snowflake, TypeScript

Libraries/APIs

TensorFlow, Scikit-learn, NumPy, Pandas, PyTorch, PySpark, LSTM, Natural Language Toolkit (NLTK), Spark ML, Amazon API

Paradigms

数据科学、ETL、商业智能(BI)、互操作性、定量研究

Platforms

Anaconda, Jupyter Notebook, Amazon Web Services (AWS), Databricks, Azure, NVIDIA CUDA, MacOS, Docker, Amazon EC2, AWS Lambda

Other

Business Administration, Innovation, Machine Learning, Neural Networks, Deep Neural Networks, Deep Reinforcement Learning, Transformers, 自然语言处理(NLP), Reinforcement Learning, English, Autoencoders, Medical Imaging, Algorithms, Artificial Intelligence (AI), 人工神经网络(ANN), Data Analysis, Analytics, Database Analytics, Data Engineering, Predictive Modeling, Predictive Analytics, Data Mining, Data Modeling, Data Reporting, ETL Tools, Text Mining, Task Analysis, Statistical Modeling, OCR, Graphics Processing Unit (GPU), Oncology & Cancer Treatment, GPT, 生成预训练变压器(GPT), Sentiment Analysis, Financial Modeling, Regression, Models, Communication, Research, Microsoft Azure, Few-shot Learning, Web Crawlers, Deep Learning, Classification Algorithms, Software Engineering, Computer Vision, Vision Transformer (ViT), 递归神经网络(rnn), Long Short-term Memory (LSTM), Web Scraping, 残余神经网络(ResNet), 机器学习操作(MLOps), Data Visualization, Statistical Data Analysis, Data Analytics, Excel 365, Image Processing, Cloud, Source Code Review, Code Review, Backtesting Trading Strategies, 通用人工智能(AGI), 生成对抗网络(GANs), Leadership, Windows 10, BERT, Learning, Rankings, Dedupe.io, 卷积神经网络(CNN), Meta-learning, 3D Images, Images, Health, Medical Software, ARIMA, SVMs, Support Vector Machines (SVM), Variational Autoencoders, Data Transformation, LSTM Networks, Big Data, Recommendation Systems, B2C Marketing, Analysis, Statistics, MLflow, Finance, Technical Hiring, Interviewing, Linear Regression, Clustering, Surveys, Survey Development & Analysis, Biotechnology, Genetic Algorithms, Mathematics, Algorithmic Trading, GPU Computing, Google Cloud ML, FastAPI, Image Generation, Cognitive Search, Classification, VM, Deduplication

Frameworks

LightGBM, Selenium, Presto, Apache Spark, Streamlit, Spark

Tools

Spyder, Atlassian, Jira, Microsoft Excel, Amazon SageMaker, Named-entity Recognition (NER), Azure Machine Learning, Microsoft Power BI, AWS CLI, AWS IAM

Storage

MySQL, MySQLi, JSON, NoSQL, Google Cloud, Google Cloud SQL, Azure Cloud Services, Database Management

Industry Expertise

Bioinformatics, Trading Systems

2020 - 2021

Ph.D. Degree in Computer Science

米纳斯吉拉斯州联邦大学-贝洛奥里藏特

2018 - 2020

计算机科学硕士学位

米纳斯吉拉斯州联邦大学-贝洛奥里藏特

2017 - 2018

工商管理硕士,主修工商管理

Dom Cabral基金会-贝洛奥里藏特

2009 - 2015

Bachelor's Degree in Medicine

米纳斯吉拉斯州联邦大学-贝洛奥里藏特

NOVEMBER 2022 - PRESENT

AWS学院毕业生- AWS学院云基础

亚马逊网络服务培训和认证

JANUARY 2014 - PRESENT

剑桥高级英语证书

Cambridge Assessment English

Collaboration That Works

How to Work with Toptal

在数小时内,而不是数周或数月,我们的网络将为您直接匹配全球行业专家.

1

Share your needs

在与Toptal领域专家的电话中讨论您的需求并细化您的范围.
2

Choose your talent

在24小时内获得专业匹配人才的简短列表,以进行审查,面试和选择.
3

开始你的无风险人才试验

与你选择的人才一起工作,试用最多两周. 只有当你决定雇佣他们时才付钱.

Top talent is in high demand.

Start hiring