2019年/10月/26日
智能应用8个误区
我做了多年的智能风控决策系统,包括从数据接入,数据提取,到模型加工,最后的决策引擎,始终让我觉得机器在智能领域要走的路还很长,最近无意翻了下一本书《智能web应用》 里面有几个关于这个领域的误区观点让我深深的认同,行业表象繁华,其实内涵引人深思
误区一:数据是可靠的
太多因素导致数据不可靠
开发数据和产品数据不一致
太多缺失值
数据可能会变
数据没有规范化
所想的算法可能不适合数据
误区二:计算能马上完成
任何解决方案的计算都需要时间
不能盲目的假设计算时间
需要仔细测试算法的性能
误区三:不考虑数据规模
小量数据和大量数据的投入差异巨大
数据规模带来的影响是多方面的
误区四:不考虑解决方案的可扩展性
不要相信所有算法都是可扩展的
设计的开始阶段就要关注算法的可扩展性
误区五:随处使用相同的方法
这个就是知名的锤子理论,哪里都是钉子
没有通适的方案,不要抱有幻想
看问题维度要高,发现其局限性
利用不同的方法解决不同的问题
误区六:总是能知道计算时间
计算领域的蝴蝶拍翅膀问题
有可能仅仅是微小的数据变化就可能导致剧烈的时间变化
误区七:复杂的模型更好
任何事情都是过犹不及
我们应该从简单的模型开始
KISS原则永远是软件工程师的好伙伴
误区八:存在无偏见模型
无知和偏见冲刺着我们的生活
我们应该注意解决方案中的偏见倾向
偏见会使我们受已知事实的限制