位置预测系列(一)
关于位置预测,在每年的顶级会议上都有很多文章出炉。下面就简单说说ubicomp'13年录用的一篇论文: The Influence of Temporal and Spatial Features on the Performance of Next-place Prediction Algorithms。
1.1 Motivation
1.2 Model
在这篇论文里面,作者首先定义了几个跟位置转移相关的预测精度(预测算法的性能评估指标)。然后,基于所定义的评估指标分别分析了基于位置特征或时间特征的18个预测算法性能。根据对比结果,作者发现基于位置特征的预测算法虽然整体预测精度比较高,但是在检测用户位置间转移时表现不理想。基于时间特征的预测算法表现却恰恰相反。基于这个观察,作者通过多数票决的方式将这18个位置预测算法组合在一块,以便在保持预测精度的同时还能够有效地检测出用户在不同位置间的转移。在此基础上,作者进一步提出了参数优化方案来提高位置转移的检测精度。作者将位置预测分为两种情况:(1)位置发生转移的情况下进行位置预测(2)位置未发生转移的情况下进行位置预测。根据统计结果,当位置发生转移时,在组合算法的票数结果中,真正转移到的下一个位置所获得的票数平均是8;当位置没有发生转移时,组合算法所预测的转移位置获得的票数平均是3。作者设定阈值为6,即当组合算法预测的转移位置所得到的票数超过6时,那么这个转移位置就是所预测的下一个位置,即使用户当前的位置所得到的票数更多,也不予考虑。(有点绕,见下图说明)
1.3 Merits and demerits
作者对位置预测问题算是给出了一种稍微新颖的阐述,将一天分成96个时间段,每个时间段的时间间隔为15分钟,位置预测算法的目的就是预测出下一个时间段用户将会在哪。这样虽然可以更加有效地捕捉到比如用户离开家或者到家这样一些类似事件,但是每隔15分钟就要运行一次算法,智能手机难免有点吃不消。
UbiComp'12年录用的位置预测的一篇论文是通过加权组合的方式将多个位置预测算法组合起来的。这里,作者采用的是多数票决的组合方式并结合阈值优化,从而省去了加权参数训练的过程。
总的来说,这篇论文是属于应用马尔科夫模型来做位置预测的派别,所做的一个隐含假设是用户将要访问的下一个位置一定是以前去过的。因此,这篇论文所提出的方法在用户初期轨迹稀疏时会遭遇"冷启动"问题。