1、 数据挖掘技术在电信计费系统中 的应用 学 生: 学 号: 专 业:信息管理与信息系统 班 级:2009 级 1 班 指导教师: 二 O 一三年六月 数据挖掘技术在电信计费系统中的应用 摘要 本毕业论文所介绍的是数据挖掘技术在电信计费系统中的应用。 数据挖掘是 从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、事 先不知道的、但又是潜在有用的信息和知识的过程。随着网络的高速发展,一些 大型厂商推出了服务器出租这项业务。为了使得出租商快捷、方便以及高效的统 计出用户的登录信息及应缴费情况,本论文开发了一个电信计费系统。 本系统采用 C/S 架构,在 UNIX 环境下以 C+为主
2、要的开发语言开发完成。 客户端的功能包括定时从服务器日志文件采集用户数据,匹配登入/登出信息, 向服务器发送数据;服务端的功能包括接收客户端发送过来的数据,存储数据和 整合数据等。 关键词:毕业设计;电信计费系统;数据匹配;数据整合 The Application of Data Mining Technology in the Telecom Toll System Abstract Described in this thesis is the application of data mining technology in the telecommunications billing s
3、ystem. Data mining is implied from a large number of incomplete, noisy, fuzzy, random data in which, not known in advance, but potentially useful information and knowledge. With the rapid development of the Network, some large companies such as China Telecom launched the server rent business. In ord
4、er to statistic user login information and charge more fast, conveniently and efficiently, a Telecom toll system is developed in this paper. This system is programmed by C+ language with C/S architecture in UNIX operating system. The functions in client port include reading user information from ser
5、ver log file ,matching data and sending data to a server. The functions in sever port include receiving data from client, data storage and integrating data. Keywords: Graduation design, the Telecom toll system, Data match, Data integration 目 录 第1章 绪论 1 11 1 系统背景系统背景 在电信的业务中,有一种 Unix 实验室出租业务。只要用户向电信运
6、营商申 请一个 Unix 帐号,就可以远程登录 Unix 实验室,并使用 Unix 系统。用户使用 电信运营商提供的 Unix 实验室的服务需要缴纳一定的费用,电信运营商需要一 套数据采集系统,把用户登录实验室的时间长度数据采集起来,便于在指定的时 间范围内作为对用户的收费依据。要求数据采集系统必须采集如下信息:登录用 户名,登录的时间,登出的时间,登录总的在线时间,登录的实验室 IP,用户 的终端 IP 等信息。系统需要开发这样一个通用的数据采集系统程序来采集 Unix 机器记录的用户登入和登出的原始记录, 并将这些记录解析匹配成用户的登录记 录,然后发送给数据采集服务器,在服务器端将这些数据以日期为单位保存在数 据库中,然后整合这些数据形成日报表,月报表和年报表。 1 12 2 系统原理系统原理 任何用户登录 Unix 系统,Unix 系统都会记录用户的登录信息,所有用户登 入/登出的信息都保存在 Unix 的系统日志文件中。数据采集系统就是通过读取 Unix 系统日志文件中用户登入/登出信息,并找出成对的登入/登出记录,得到 用户登录实