论文阅读和分析:Hybrid Mathematical Symbol Recognition using Support Vector Machines
创始人
2025-06-01 01:36:41
0

主要贡献:

1、提出了一种基于支持向量机的混合识别系统,该系统同时使用在线和离线信息进行分类。

2、并行运行的两个基于支持向量机的多类分类器的概率输出通过加权和进行组合。实验结果表明,赋予在线信息稍高的权重会产生更好的结果。混合系统在单独使用时的整体错误率低于在线和离线识别系统。

复习SVM

下面所说的,在libsvm都有实现

SVMs基于两个观点:VC维度和最小化结构风险。

在VC理论中,最常用的概念为VC维(VC dimension)。VC维度(或Vapnik-Chervonenkis维度)是衡量可以通过统计分类算法学习的函数空间的容量(复杂度,表现力,丰富度或灵活性)的度量。它被定义为算法可以破碎(shatter)的最大点集的基数,在这里破碎(shatter)意为若对于一个假设空间H,如果存在m个数据样本能够被假设空间H中的函数按所有可能的2^h种形式分开,则称假设空间H能够把m个数据样本破碎(shatter)。在二维平面上的简单理解就是可以使得线性划分数据集所有点类别的最小直线数目。

SVMs遇到线性不可分的情况下,理论上在一个更高的维度空间可以线性可分,相当于给一个非线性决策平面在原来的特征空间。可以表示成:
f(x)=∑iαiyiK(x,xi)+bf(x)=\sum_i\alpha_iy_i K(x,x_i)+b f(x)=i∑​αi​yi​K(x,xi​)+b

yiy_iyi​:label;

xix_ixi​:训练样本;

xxx:待分类样本;

K(x,xi)=ϕ(x)ϕ(xi)K(x,x_i)=\phi(x) \phi(x_i)K(x,xi​)=ϕ(x)ϕ(xi​):核函数:
K(a,b)=exp⁡(−γ∣∣a−b∣∣2),γ>0(radial basis fns)K(a,b)=(γ(a⋅b)+r)d,γ>0(polynomial)K(a,b)=tanh⁡(γ(a⋅b)+r)(sigmoid)\begin{array}{l} K(a,b)=\exp(-\gamma||a-b||^2),\gamma>0\text{(radial basis fns)}\\ K(a,b)=(\gamma(a\cdot b)+r)^d,\gamma>0\textrm{(polynomial)}\\ K(a,b)=\tanh(\gamma(a\cdot b)+r)\textrm{(sigmoid)} \end{array} K(a,b)=exp(−γ∣∣a−b∣∣2),γ>0(radial basis fns)K(a,b)=(γ(a⋅b)+r)d,γ>0(polynomial)K(a,b)=tanh(γ(a⋅b)+r)(sigmoid)​

一般而言,SVMs用于二分类任务,多分类任务用DAG and one-against-one作为多分类的实现。

同时,要让SVMs输出后验概率,需要使用sigmoid函数:
p(y=1∣f(x))=11+exp⁡(Af(x)+B)p(y=1|f(x))=\dfrac{1}{1+\exp(Af(x)+B)} p(y=1∣f(x))=1+exp(Af(x)+B)1​

f(x)f(x)f(x):SVM的输出;

A和B:可以从负的log-likelihood 函数在训练数据得到;

架构

使用在线特征和离线特征,通过两个不同的SVM分类器,得到每个类别的概率,联合求出总的概率,得到结果。

联合:
P(Ci∣X)=αP(Ci∣X,ONF)+β(Ci∣X,OFF)P(C_i|X)=αP(C_i|X,ONF)+β(C_i|X,OFF) P(Ci​∣X)=αP(Ci​∣X,ONF)+β(Ci​∣X,OFF)

α+β=1\alpha + \beta = 1α+β=1

在这里插入图片描述

在线特征向量

预处理:

1、smoothing:使用中心平滑去平滑墨水的笔迹;
xi=0.25xi−1+0.5xi+0.25xi+1yi=0.25yi−1+0.5yi+0.25yi+1\begin{array}{rcl}x_i&=&0.25x_{i-1}+0.5x_i+0.25x_{i+1}\\ y_i&=&0.25y_{i−1}+0.5y_i+0.25y_{i+1}\end{array} xi​yi​​==​0.25xi−1​+0.5xi​+0.25xi+1​0.25yi−1​+0.5yi​+0.25yi+1​​
2、Filling intermediate points:在连续的点之间填充内部点,这样对齐空间,没有对齐时间,因为发现空间对齐比时间对齐更有用。因此,在重新采样时,我们将笔画上的点放置在相等的距离上。

3、resample重采样:每个笔画选择每N/11thN/11^{th}N/11th的点,N是总的点数;

4、size normalization尺度归一化:每个stroke使用1/max(h,w)1/max(h,w)1/max(h,w)进行归一化;

提取特征:

发现坐标和角度信息是最有区分度的特征,增加图形特征例如相关长度,错误率降低很小但是特征向量更多;

计算重心:
∑i(xi/N),∑i(yi/N),\sum_i(x_i/N),\sum_i(y_i/N), i∑​(xi​/N),i∑​(yi​/N),
转过的角度:

在这里插入图片描述

因此得到的特征包括:

特征:
stroke笔画的每个点的坐标
line segments的sines和cosines值
line segments和符号重心的sines和cosines值

离线特征向量

1、离线特征是将stroke转换成图片,存储样本文件在InkML格式,这些文件加载使用black ink在white背景上,使用Microsofts Tablet PC SDK.

2、转换到bitmap后,进行尺度缩放:15/max(w,h)15/max(w,h)15/max(w,h)。

3、使用high-quality bilinear interpolation filter,填补边缘得到bitmap 15*15大小。

在这里插入图片描述

提取的特征:

特征:
(I1,I2,...,IN)(I_1,I_2,...,I_N)(I1​,I2​,...,IN​):灰度强度像素点的值N=w∗hN=w*hN=w∗h。

参考:

《Hybrid Mathematical Symbol Recognition using Support Vector Machines》
VC维度 | 机器之心 (jiqizhixin.com)

相关内容

热门资讯

AWSECS:访问外部网络时出... 如果您在AWS ECS中部署了应用程序,并且该应用程序需要访问外部网络,但是无法正常访问,可能是因为...
AWSElasticBeans... 在Dockerfile中手动配置nginx反向代理。例如,在Dockerfile中添加以下代码:FR...
银河麒麟V10SP1高级服务器... 银河麒麟高级服务器操作系统简介: 银河麒麟高级服务器操作系统V10是针对企业级关键业务...
北信源内网安全管理卸载 北信源内网安全管理是一款网络安全管理软件,主要用于保护内网安全。在日常使用过程中,卸载该软件是一种常...
AWR报告解读 WORKLOAD REPOSITORY PDB report (PDB snapshots) AW...
AWS管理控制台菜单和权限 要在AWS管理控制台中创建菜单和权限,您可以使用AWS Identity and Access Ma...
​ToDesk 远程工具安装及... 目录 前言 ToDesk 优势 ToDesk 下载安装 ToDesk 功能展示 文件传输 设备链接 ...
群晖外网访问终极解决方法:IP... 写在前面的话 受够了群晖的quickconnet的小水管了,急需一个新的解决方法&#x...
不能访问光猫的的管理页面 光猫是现代家庭宽带网络的重要组成部分,它可以提供高速稳定的网络连接。但是,有时候我们会遇到不能访问光...
Azure构建流程(Power... 这可能是由于配置错误导致的问题。请检查构建流程任务中的“发布构建制品”步骤,确保正确配置了“Arti...