Frontiers of Information Technology & Electronic Engineering

ISSN 2095-9184 (print), ISSN 2095-9230 (online), monthly

<<<                         CONTENTS                         >>>

Research Articles

An intuitive general rank-based correlation coefficient

Divya Pandove, Shivani Goel, Rinkle Rani

DOI: 10.1631/FITEE.1601549 Downloaded: 629 Clicked: 1359 Cited: 0 Commented: 0(p.699-711) <Full Text>   <PPT>  144

Chinese summary   <8>  一种直观的一般秩相关系数

概要:相关分析是研究数据模式和预测的有效机制。在看似无关的数据中建立相关性可得到许多有趣发现。提出一种算法,用于量化相关性理论并得出一个直观且更精确的相关系数。为计算配对值之间相关性,提出一项预测指标,称为一般秩相关系数。其满足预测指标的5个基本标准:样本规模的独立性、数值介于−1与1之间、测量单调性程度、对异常值不敏感性、直观演示。此外,使用实时数据集和随机数模拟实验对该指标进行验证。同时,展示了所提方程的数学推导过程,并与斯皮尔曼等级相关系数比较。结果表明,该指标在所有预测度量标准上均优于现存指标。

关键词组:一般秩相关系数;多变量分析;预测指标;斯皮尔曼等级相关系数

Discovering optimal features using static analysis and a genetic search based method for Android malware detection

Ahmad Firdaus, Nor Badrul Anuar, Ahmad Karim, Mohd Faizal Ab Razak

DOI: 10.1631/FITEE.1601491 Downloaded: 1417 Clicked: 1421 Cited: 0 Commented: 0(p.712-736) <Full Text>   <PPT>  128

Chinese summary   <5>  一种使用静态分析和遗传搜索在Android恶意软件检测中搜索最优特征的方法

概要:移动设备制造商在全球范围内快速开发各种Android版本。同时,网络罪犯也在实施各种恶意行为,例如跟踪用户活动、窃取个人数据以及实施银行诈骗。由于在日常生活中使用Android进行重要通信的人群数量庞大,这些网络罪犯从中获得了巨大非法收益。为此,安全从业者通过静态和动态分析对恶意软件进行识别。静态分析具有整体代码覆盖、低资源消耗和快速处理的优势。然而,静态分析需要最少量的特征才能对恶意软件进行有效分类。因此,我们采用基于遗传算法(GA)的遗传搜索(GS)在106个字符串中选择特征。为评估由GS确定的最佳特征,我们使用了5种机器学习分类器,分别是Naïve Bayes(NB)、功能树(FT)、J48、随机森林(RF)和多层感知器(MLP)。在这5种分类器中,FT仅使用6种特征,获得最高准确度(95%)和最高真正率(TPR)(96.7%)。

关键词组:遗传算法;静态分析;Android;恶意软件;机器学习

An oversampling approach for mining program specifications

Deng Chen, Yan-duo Zhang, Wei Wei, Rong-cun Wang, Xiao-lin Li, Wei Liu, Shi-xun Wang, Rui Zhu

DOI: 10.1631/FITEE.1601783 Downloaded: 432 Clicked: 1121 Cited: 0 Commented: 0(p.737-754) <Full Text>   <PPT>  114

Chinese summary   <5>  一种用于程序约束挖掘的过采样方法

概要:自动协议挖掘是获取精确而完备的API使用协议的有效方法。然而,与其它数据挖掘应用类似,自动协议挖掘方法需要足够多训练数据(即对象使用场景)作为输入。虽然通过增加程序的规模可提取更多数量的对象使用场景,但这会导致程序分析运行时开销较大。本文针对面向对象程序提出一种基于继承关系的对象使用场景过采样方法。给定一个面向对象程序p,一般情况下,执行p所能获得的对象使用场景数不超过运行时实例化的对象数。而本文方法可获得多达上述n倍的对象使用场景,其中n为程序p中一般对象使用场景的平均父类数。为了验证效果,在前期API使用协议动态挖掘原型工具ISpecMiner中集成上述方法并开展实验研究。实验采用扩展后的ISpecMiner从多个实际的程序中挖掘API使用协议。结果显示,采用本文方法获得的对象使用场景数是一般化方法的1.95倍。不仅如此,对比实验结果表明本文方法有利于挖掘更加精确而完备的API使用协议。特别值得关注的是,本文方法适用于无法实例化的类并挖掘出其API使用协议。这类API使用协议对于验证软件架构、程序说明和理解具有重要意义。虽然本文方法会增加一定的运行开销,但其仍在可接受范围内。

关键词组:对象使用场景;API协议挖掘;程序时序约束挖掘;过采样

Stochastic extra-gradient based alternating direction methods for graph-guided regularized minimization

Qiang Lan, Lin-bo Qiao, Yi-jie Wang

DOI: 10.1631/FITEE.1601771 Downloaded: 525 Clicked: 1414 Cited: 0 Commented: 0(p.755-762) <Full Text>   <PPT>  154

Chinese summary   <6>  图引导正则最小化的随机超梯度的交替方向方法

概要:提出并比较额外梯度交替方向的几种随机变体方法,称为带拉格朗日函数(SEGL)的随机超梯度交替方向法和带增广拉格朗日函数(SEGAL)的随机超梯度交替方向法。这些方法由两个大规模凸目标函数组成,可最小化图形引导的优化问题。机器学习中一些重要应用遵循图导引优化公式等作为线性回归、逻辑回归、Lasso结构化扩展以及结构化正则化逻辑回归的原则。通过融合逻辑回归和图形引导正则化回归,在几类数据集上进行了试验。试验结果表明所提算法优于其他竞争算法,且在实际应用中,SEGAL比SEGL性能更好。

关键词组:随机优化;图形引导最小化;超梯度法;融合逻辑回归;图导向正则化逻辑回归

TIE algorithm: a layer over clustering-based taxonomy generation for handling evolving data

Rabia Irfan, Sharifullah Khan, Kashif Rajpoot, Ali Mustafa Qamar

DOI: 10.1631/FITEE.1700517 Downloaded: 376 Clicked: 808 Cited: 0 Commented: 0(p.763-782) <Full Text>   <PPT>  132

Chinese summary   <4>  TIE算法:一种用于处理演化数据的聚类分层分类法生成技术上层算法

概要:分类法可实现对大量数据的有效组织和访问。分类法是表示数据概念的一种方法,其需要通过不断演进来反映数据变化。现有分类法自动生成技术无法处理数据演化,因此,所生成的分类法不能真实反映数据。为反映数据演变,可从头对分类法进行再生,或根据数据变化随时对分类法进行增量演进。其中,前者的时间和资源成本较高。提出一种新颖的分类增量进化(TIE)算法,用于处理随时间演变的数据。TIE是一种现有聚类分层分类法生成技术的上层算法,它允许现有分类法增量地演进。在计算机领域的研究论文中对该算法进行了评估。结果表明,与从头再生分类法相比,随数据演化的分类法生成算法耗时非常短,且在单位时间下性能更佳。

关键词组:分类法;聚类算法;信息科学;知识管理;机器学习

Affective rating ranking based on face images in arousal-valence dimensional space

Guo-peng Xu, Hai-tang Lu, Fei-fei Zhang, Qi-rong MAO

DOI: 10.1631/FITEE.1700270 Downloaded: 361 Clicked: 724 Cited: 0 Commented: 0(p.783-795) <Full Text>   <PPT>  127

Chinese summary   <3>  激活-效价维度空间中基于脸部图像的情感等级排序方法

概要:在维度情感识别领域,分类和回归通常被用来对情感的机器学习进行建模和预测。然而,在维度情感空间中,情感标注通常是一个连续的实数值,拥有有序属性。而前面所提的两种方法并没有考虑并利用这一重要信息。因此,我们提出一个在激活和效价维度空间下的基于脸部图像的情感等级排序框架。我们的方法能够通过离散化连续的情感标注得到情感等级,并恰当地利用它们之间的有序信息。确切地说,首先训练一系列基本误差敏感二分类器,每个二分类器都使用经过二值重新标注的全部样本。依据样本对应的情感等级与给定二分类器对应的情感等级的比较结果,对二值进行重新标注。然后通过聚合所有二分类器的输出结果,可以得到样本最终的情感等级预测结果。在AVEC 2015挑战赛标准数据集和SEMAINE子集数据集上对所提方法与基本的和基于深度学习的分类和回归方法进行比较。实验结果表明,所提出的基于排序的情感识别方法在激活和效价两个维度上都是有效的。

关键词组:有序排序;维度情感识别;效价度;激活度;脸部图像处理

Assembly variation analysis of flexible curved surfaces based on Bézier curves

Zhen-yu Liu, Shi-en Zhou, Jin Cheng, Chan Qiu, Jian-rong Tan

DOI: 10.1631/FITEE.1601619 Downloaded: 612 Clicked: 1213 Cited: 0 Commented: 0(p.796-808) <Full Text>   <PPT>  156

Chinese summary   <2>  基于Bézier曲线的柔性曲面装配变动分析

概要:在装配过程中,柔性零件表面特征会发生形状变化,相比刚性体,其变动分析复杂许多。现有柔性装配变动分析方法大多未考虑零件表面邻近点的相互关系,或者将零件表面上所有特征点的概率分布情况视为统一。本文将柔性曲面零件装配简化为边侧线匹配问题,提出基于Bézier曲线来表征曲面零件边侧线的方法,解决了柔性零件装配中考虑表面连续性的曲面零件装配变动分析问题。该方法利用控制点变动来获取零件边侧线上特征点的偏差,并将它们作为输入参数进行有限元分析,从而计算出最终产品变形量。通过天线表面装配的两个实例,对所提方法进行了验证。

关键词组:装配变动分析;特征点;边侧线;柔性曲面;Bézier曲线

A general method of designing phase-shifting algorithms for grating lateral shearing interferometry

Chao Fang, Yang Xiang, Ke-qi Qi

DOI: 10.1631/FITEE.1601692 Downloaded: 403 Clicked: 1169 Cited: 0 Commented: 0(p.809-814) <Full Text>   <PPT>  123

Chinese summary   <3>  一种用于抑制相移误差和零级串扰的相移算法通用设计方法

概要:为降低零级串扰和相移误差对光栅横向剪切干涉仪波前复原精度的影响,进一步提升光栅横向剪切干涉仪检测光刻镜头系统波像差精度,推导出一种设计光栅剪切干涉相移算法的一般表达式,给出相移算法的具体设计方法。根据该表达式和设计方法,可以针对不同的零级串扰和相移误差建立相应的4种相移算法,实现高精度系统波像差检测。同时设计和评价了一种新的13步相移算法,结果证明所推导的一般表达式的有效性和先进性。

关键词组:测量;横向剪切干涉仪;相移算法;相位复原

Journal of Zhejiang University-SCIENCE, 38 Zheda Road, Hangzhou 310027, China
Tel: +86-571-87952783; E-mail: cjzhang@zju.edu.cn
Copyright © 2000 - Journal of Zhejiang University-SCIENCE