印度机器学习团队的技术创新与全球影响
应对独特的市场挑战
为满足超过6亿在线用户的多元化需求,技术团队开发了一系列针对性解决方案。
针对印度移动网络速度波动大的问题,构建了预测模型。该模型能基于设备特征、蜂窝基站信息和上一次请求的延迟等标准,识别出连接缓慢或不稳定的用户。对于这类用户,系统会提供自适应体验,并推送经过精简、更易于浏览的页面[citation:1]。
提升搜索与目录质量
面对超过22种语言和19,500种方言的复杂性,在搜索结果排序中加入了产品的地区性销量作为特征,以突出区域性的热门商品[citation:1]。
在目录质量方面,运用了多种深度学习模型。例如,使用注意力机制引导卷积神经网络专注于图像中需要提取产品颜色的特定区域,从而从产品标题和图像中提取颜色等属性,并补全缺失的产品信息[citation:1]。此外,还利用半监督学习技术对神经网络进行广泛训练,这大大减少了对大量标注数据的需求。
优化可持续包装的算法创新
为实现可持续发展目标,团队致力于通过技术创新减少浪费。在今年的欧洲机器学习会议上,团队展示了一种用于确定产品最佳包装方式的新模型[citation:1]。
确定最优包装方案存在挑战,例如缺乏足够的真实数据,以及需要确保预测的“顺序性”(即更便宜、防护性更弱的包装选项应有更高的损坏概率)。团队为此开发了一个线性模型,通过精心设计的模型参数约束来保证顺序性。此外,还采用了数据增强技术:对于一个导致产品损坏的“产品-包装”组合,系统会额外添加该产品与防护性更弱的包装组合的示例,并将其同样标记为会导致损坏[citation:1]。该模型已应用于数十万个包裹,在显著减少运输损坏的同时,实际降低了运输成本。
利用科学应对全球疫情
在新冠疫情期间,技术团队迅速开发工具以帮助保障安全。为生成个体感染风险评分,与科学家合作开发了一个名为CRISP的概率图模型,用于模拟新冠病毒通过个体接触的传播[citation:1]。
该模型基于经典的SEIR(易感-暴露-感染-移除)流行病学模型框架,跟踪个体的不同状态转换,并考虑了检测结果。开发了块吉布斯采样算法,根据接触数据和测试结果抽取每个个体潜在感染状态的样本,用于计算风险评分。同时,还开发了蒙特卡洛期望最大化算法,以推断每次接触的感染传播概率,并考虑接触持续时间、距离和地点(室内/室外)等因素[citation:1]。
此外,运营团队建立了虚拟取货点,向被隔离公寓楼的顾客递送包裹。通过地址分割机器学习模型从客户输入的送货地址中提取公寓楼名称,然后向这些客户发送电子邮件通知新功能[citation:1]。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)
公众号二维码

公众号二维码


浙公网安备 33010602011771号