为了适应网络图像内容复杂多样的需求,如何将图像语义学习系统的词汇提高一个数量级,从目前的几十个增加到几百个,上千个。
方案I:充分利用网络图像的用户标识资源,开发我们的训练数据集。
通过图像色度纹理空间特征的不同组合,局域与全局特征的选取,不同机器学习算法的有效结合,来提高图像语义学习的性能。
通过图像语义和文本语义的有机结合来提高网络信息检索的准确性。
多年来,学者们在以上提到的几个环节已经做出了大量的工作。我们的第一步工作是了解技术动态,有针对性地对个别算法进一步进行探讨和改进,以适应我们的系统要求,并提高系统性能。
我们在人力和资源方面和微软这样的大机构没法想比,因此,要做出我们的贡献,必须抓住我们能有所作为的关键点,比如人脸目标的重建。此外,不同算法的有机结合往往能取长补短达到好的效果。这些还有待进一步实验验证。
高动态范围图像采集将从信源方面解决问题,减轻系统对后续技术性能的要求。我们相信,开发出实用的高动态范围图像序列采集系统,将使视频监控系统离实时实用跨出一大步。