联系方式
- Email:howie6879@gmail.com
- QQ:1757297452
个人信息
- howie.hu/男/1995
- 本科(2013~2017),在职研在读中
- 工作年限:实习1年+工作4年
- Github:http://github.com/howie6879
- Blog:https://www.howie6879.cn/,如果无法访问请翻墙
工作经历
厦门某游戏公司 (2017年7月 ~ 至今)
团队负责人,负责团队的组建&管理工作(团队成员7人左右浮动)
我主要负责的工作内容如下:
- 从0到1构建公司的风控系统,大概可以从以下三个方向介绍:
- 基础设施:
- 构建数据收集处理体系
- 定义服务模板(目前有实时、软实时、离线服务模板),同时构建团队脚手架以快速开发
- 自研ETL处理框架、风控引擎
- 行为分析系统:监控用户从注册到结束整个生命周期的风险点,比如登录注册异常检测、外挂行为检测、各大场景外挂行为检测
- 数值分析系统:检测数值相关的风险,比如:
- 游戏生态风险评估
- 用户信用评估、群体等级变动监控、用户流失等
- 微服务数值异常监控
- 文本分析系统:游戏内聊天、邮件、联盟的广告识别,这块有申请专利,除了满足本公司多款游戏的需求,还同时为三家以上公司提供服务
- 基础设施:
- 用户画像平台:
- 构建标签体系,为客服&运营等业务人员提供数据相关服务
- 自行分析客服运营人员的业务需求,并给出智能化的解决方案,如流失预测与介入、商城礼包个性化推荐
- 基于团队的技术以及业务积累,构建满足低代码以及云开发这两点特性的一站式机器学习平台,目标在于解决以下问题:
- 团队协作:项目管理,技术&业务的共享如何体现在实际解决问题的过程中
- 资源调度:数据处理、模型训练
- 模块共享:低代码甚至无代码
- 快速开发:快速试错、实践、测试、部署
- 需求->开发的闭环
厦门某电子商务有限公司 (2016年7月 ~ 2017年5月)
大三的实习经历,主要工作内容如下:
- 对LinkedIn近一千万公司数据进行爬取(基于pyspider的分布式爬虫):对数据进行分析,构建客户画像与分类模型
- 公司名搜索服务:通过用户输入公司名,自动返回公司主页、公司地址、邮箱、社交主页等信息,解决客服的信息获取痛点
- 后端接口编写(Django)
项目经历
开源项目
- Ruia:An async web scraping micro-framework based on asyncio. 个人编写的异步爬虫框架,获得过Trending榜单第二,目前Star数1.4K左右
- 2c:构建一个多源(公众号、RSS)、干净、个性化的阅读环境
- owllook:毕业设计,目的是做成集搜索、阅读、追更、收藏、推荐于一体的小说搜索引擎和小说推荐系统,star数2K左右,fork数600+,演示网站月pv达到近50万,日ip4K左右
- mlhub123:机器学习深度学习导航交流项目,官网:https://www.mlhub123.com,目的是构建一个机器学习高质量交流群体,组织书籍共读交流活动
- toapi:让任何网站提供api,和朋友一起开发,项目核心团队成员之一,多次上Trending榜单第一,star数3K+
贡献项目
- sanic: 一个异步web框架,修复中文编码route的bug,见#1081,参数检查机制,见#1097
- text-classification-cnn-rnn:CNN-RNN中文文本分类,基于tensorflow,PR修复了在同样训练集情况下python2训练的模型准确率偏低的问题
- GraphScope:阿里开源的一站式的图计算系统,贡献了
K8s
的远程连接特性(#40) - orchest:A new kind of IDE for Data Science. 修复项目检测失败的问题(#117)
- ……
开源书籍
- Sanic-For-Pythoneer:结合自身使用经历,编写的一份sanic框架的开源书籍
课程
- Python实现搜索引擎:受蓝桥实验楼邀,制作的一门关于Python实现搜索引擎的实践课程
奖项&荣誉
荣誉
- 2020蓝桥实验楼年度优秀作者
- 专利:CN110059189A_一种游戏平台消息的分类系统及方法
奖项
- 2016年全国计算机设计大赛服务外包全国一等奖:来自浙江大学命题的互联网新闻推荐系统
- 2015年全国计算机设计大赛服务外包全国二等奖:自主命题,同时获得惠州市恺炬杯三等奖、本市创新创业二等奖
- TCL励志奖学金
致谢
感谢您花时间阅读我的简历,期待能有机会和您共事,祝您生活愉快。