登录
首页 » Others » C#网站源码!学习专用!

C#网站源码!学习专用!

于 2020-11-30 发布
0 196
下载积分: 1 下载次数: 0

代码说明:

C#网站源码!学习专用!很不错的源码,建议新手门看看,我也在学习中,呵呵

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • 数字万用表的设计
    一个很不错数字万用表设计,内有详细的电路设计及介绍。流电阻或其他电参量的仪表,其功能可以任意组合并以十进制数字显示被测量结果,应用十分广泛,在传统的电工和电子测量中广泛使用的模拟测量仪虽然具有观察着可以自接看出表针偏转了多个格或满刻度的白分之儿等优点,但要对读数加以换算或说明尤其是不可避免的带来人为视差,不同的观察者可得出不同的结果,数字万用表则不同,他可以直接将测量结果用数字显示出来。数字万用表具有10大特点显示清晰直观,读数准确:为了提高观察的清晰度,新型手持式数字万用表(HDMM)已普遍用字高为26mm(约Lin)的大屏幕LCD(液晶显示器)。有些数字万用表还增加∫背光源,以便于夜间观察读数。为∫提高显示亮度,台式数字万用表大多选用LED数码管或数码管(VFD)。新型数字万用表还增加了标识符显示功能,包括测量项目符号(例如AC、DC、hFF、IOΩ2、IO(iIC、MFM),单位符号(例如mV、V、kV、μA、mA、A、g、k2、M2、nS、H、k、MHz、pF、n、、℃、),特殊符号(如低电压指示符号OBAT”、读数倮持符号“HOID¨或“DH、峰值保持符号“ PEAK HOLD或PH、自动量程符号AUIO、10倍乘符号“*10”、峰鸣器符号等)。有些数字万用表还在液晶显示器的小数点下面设置了量程标识符,例如当小数点下边显示200时,就表明所对应的量程为200,依次类推。为解决数字万用表不能反映被测电压的连续变化过程以及变化趋势这一难题,一种“数字模拟条图仪表也以问世。这里讲的模拟条图有双重含义:第一,被测量为连续变化的模拟量:第二,利用条图形来模拟被测量的大小及变化趋势。这类仪表将数字显示与高分辩率模拟条图显示集于一身,兼有数字万用表与指针万用表之优点,为用效字万用表完仝取代指针万用表创造了条件。智能数字万用表带微处理器与标准接口,可配计算机和打印机进行数据处理或自动打印,构成完整的测试系统。显示位数:字万用表的显示位数通常为312位~812位。具体讲,有31/2位、323位、334位、412位、43/4位、51/2位、612位、71/2位、812位供9种。判定数字万用表的位教有内条原则:第一,能显示从09所有数字的位是整数值;第二,分数位的数值是以最大显示值中最高位的数字为分子,用满量程时最高位的薮字作分母。例如某数字万用表的最大显示值为±1999,满量程计数值为200,这表明该仪表有3个整数位,而分数值的分子为1,分母是2,故称之为31/2位,读作三位半,其最高位只能显示0或1。需要指出的是,目前冇些新型能数字万用表的显示位数比较特殊。例如,VC8145型台式智能数字万用表的满量程值为33000,Ms8050型台式智能数字万用表的满量程值为53000,就很难将其归入哪一种显示位数。这中情况下,通常只给出满量程值。312位数字万用表设计准确度高:确度是测量结果中系统误差与随机误差的综合。它表示测量结果与真值的一致程度,也反映了测量误差的大小,真确度愈高,测量误差愈小。测量的绝对误差有以下三种表达式:△U士(a%RDG+b%KS)1-1)AU=士(a%RDG+(1-2)△U=士(a%RDG+b%S+n)式(1-1)中,RDG为读书值(即显示值),FS表示满量程值。拈号中第1项代表AD转换器和功能转换器(例如分压器)的综合误差,第2项是数字化处理所带来的误差。式(1-2)中,n是量化误差反映在末位数字上的变化量。若把n个字的误差折合成满量程的百分数,则变成式(1-1)。因此,上述二式是完全等价的。式(1-3)比较特殊,第三项通常表示由指针万用表,例如312位、412位数字万用表的准确度分别可达±0.3%、±0.05%1.14分辨力高数字万用表在最低电压量程上末位1个字所代表的电压值,称作仪表的分辨力,它反映了仪表灵敏度的高低。分辨力随显示位数的增加而提高。例如312位、412位、81/2位数字万用表的最高分辨力分别为100μV、10μVlnV。数字万用表的分辨力指标亦可用分辨率来袤示。分辨是指所能显示的最小数字(零除外)与最大数字的百分比。例如,31/2位数字万用表的分辨率为1/19990.05%。测试功能强:字万月表不仅可以测量官流电压(DCⅴ)、交流电压(ACV)、直流电流(DCA)、交流电流(ACA、电阻(g)、二极管正向压降(UF)、晶体管共发射极电流放大系数(hF),还能测量电容(C)、电导(G)、温度(T)和频率(f),而且利用峰鸣器挡(BZ)还可检查线路的通断。VC9850A+、VC9808、MS820H型数字万用表增加了电感挡。有的仪表还有信号发生器挡及AC/DC自动转换功能。新型数字万用表大多增加了下述测试功能:读书保持(HOLD)、逻辑( LOGIO)测试、真有效值(TRMS)测量、相对值(REL〕测量、自动关机( AUTO OFF POWER)、当电流挡拔错位置时的声音告警等。国产VC90型数字万用表具有语音报数功能。MS8209型五合一数字万用表,还可以测量站空比(测量范围是0.1%~999%,误差为±3.0%)、温度(测量范围是-20~400℃C或-20~-1000℃,误差为±3.0%)、相对湿度(测量范围是30%-95%,误差为±5.0%)、照度(测量范围是4000~40000x,误差为±5.0%)及噪卢(测量范围是35~10UB)。VC9808A+增加了2000M超高阻挡,VC8145A还能测量功率电平。最新丌发的33/4位~412位智能数字万用表,将高性能与低成本集于一身,大多具有下述功能:液晶条图显示( LCD Baryaph),多重显示,测量最小偵/最大值,峰值保持:数据储存,复位,数据输出,设定测量范围的上、下限,软件自动校准,快速测量等。国产MS9803R型智能数字万用表采用光电隔离的RS232C接口,还配有 PC Windows视窗软件,能在PC上记录数据及输出图表。利用MS9803R所提供的 DMM VIEW Version2软件,将MS9803R拔至直流200m挡,并通过RS-232C接口连到PC上,实测某一缓慢变化的直流电压。测量范围宽:41/2位手持式多功能数字万用表为例,其测量范围一般为:DCV(001mV~1000V),ACV(0.01mV~700V或750V),DCA(0.1A~20A), ACA DCA(1A~20A),g2(0.0192-20Mg,少数仪表可达200M92,甚至扩展到2000192),电导(0.1nS~100nS),电容(0.1pF~20pF),电感(1H~20H),频率(10Hz-20kHz,部分仪表可达200kHz,甚至扩展到10MHz),二极管正向压降UF(0~2V),晶休管电流放大系数Hf(0-1000),可满足常规电了测量的需要。智能数字万用表的测量范围更宽。测量速率快:字万用表在每秒钟内对被测电压的测量速率,单位是“次/秒”。它主要取决于AD转换器的转换速率。有的手持式数字万用表用测量周期来表示测量的快慢。完成次测量过程所需要的时间叫测量周期。显见,测量速率愈高,测量周期就愈短,二者呈倒数关系。312位数字万用表的测量速率一般为2~5次秒,多数仪表为2~3次秒。41/2位数字万用表可达20次/秒。5/2位~71/2位数字万用表一般为几十次/秒以上,有的能达到几百甚至上千次秒。H3458A型81/2位DMM工作在41/2位方式下的最高测量速率可达10万次秒,在81/2位、51/2位方式下分别为6次秒、5万次秒。测量速率与准确度指标存在矛盾,通常是准确度愈高,测量速率愈低,二者难以兼顾。解这一矛盾有两种方法:一种是增设快速测量挡,专配测量速率交快的AD转挨器;另一种方法是通过降低显示位数来大幅度提高测量速率,此法目前应用的比较普遍,可满足不同用户对测量速率的需要时。输入阻抗髙:字万用表电压挡具有很高的输入阻抗,通常为10-10000MQ,从被测量电路上吸取的电流极小,不会影响被测信号源的工作状态,能减小由信号源内阻引起的测量误差。集成度高,微功耗:持式数字万用表采用单片AD转换器,外围电路比较简单,只要少量铺助芯片和外围元件。近年来各种单片数宇万用表专用芯片竟相问世,使用片IC即可构成功能比较完善的自动量程式数字万用表,为简化设计和降低成本创造了有利条件。新型数字万用表普遍釆用CMOS大规模集成电路的AD转换器,整机功耗很低。31/2312位数字万用表设计位、41门2位手持式数字万用表的整机功耗仅几十亳瓦,可用9V叠层电池供电。51/2位~812位数字万用表的总功耗一般也只有十至几十瓦。侏护功能完善,抗干扰功能强:字万用表具有比较完善的保护电路,过载能力强,新型数字万用表还增加了高压保护器件,能防止浪用电压。使用时只要不超过规定的极限指标,即使出现误操作(例如用电阻挡去测量220V交流电压),一般也不会损坏仪表内部的大规模集成电路。当然应力求避免误操作,以免因外围元件〔如熔丝管、量程开关)损坏而影响正常使用。必须指出,仼何保护电路都不可能做到万无一失。换言之,倘若保护保护电路发生故障,仪表就失去的保护屏障。51/2位以下的数字万月表大多采用积分式AD转换器,其串模抑制比(SMR)共模抑制比(CMR)分别可达100dB、80~120dB。高档数字万用表还采用数字滤波、浮地、双重屏蔽等先进技术,进一步提高了抗干扰能力,CMR可达180dB数字万用表应用于国防、科研、工厂、学校、计量测试等技术领域,并随着技术的发展,其性能不断提高。13论文设计的主要工作本次设计通过相关资料的收集及对数字万用表工作原理分析列出总体思路,采用ICL7106型多功能低功耗单片31/2位AD转换器,选择双积分AD转换方式,设计出交流电压测量电路、直流电流测量电路、电阻测量电路、电导测量电路、频窣测量电路、电容测量电路等。研究其每个参量的测量方法及功能实现。它主要的核心是通过AD转换来实现的,通过对测量电路的原理分析设计,实现交直流电压、直流电流、电阻、电容、晶体管等测量。此次设计的31/2位教字万用表显示清晰直观、读数准确,分辨力高、测试能力强、微功耗、外围电路简单、价格便宜、成本低等优点。2312位数字万用表的结构设计2.131/2位数字万用表基本构成数字万用表的基本构成如图2-1所示。仪表的心脏是单片AD转换器,典型产品有ICL7106、ICL7136型31/位单片A①转换器。外围电路主要包括功能转换器、测量项目及量程选择开关、LCD(或LED显示器)。此外还有蜂鸣器震荡电路、驱动电路、检测线路通断电路、低电压指示电路、小数点标识符、驱动电路。LU转换器LCD(LED)功能ACDC量程选择AD转换器数字电路诜择转换器Q/U转换器www.dola.com图2-1数字万用表基本构成Fig 2-1 The basic component of ordinary digital multimeter2,2功能转换器的介绍及基本工作原理尽管数字万用表的型号繁多,整机电路也各有差异,但其基本测量原理大致相同。下面介绍数字万用表最常用的几种功能转换器的电路工作原理,对于本次数字万用表设计原理与应用具有重要的意义22.1线性ACDC转换器数字万用表的交流/直流(ACDC)转换器分平均值响应的AC/DC转换器、真有效值/直流( TRMS/DO)转换器两种平均值响应的线性ACDC转换器是由运算放大器和二极管组成的半波(或全波)线312位数字万用表设计性整流电路。它具有线性好、准确度髙、电路简单、成本低廉等优点。由于它是按照正弦波平均值与有效值的关系而定的,因此所构成的仪表只适用于测量不失真的止弦波电压线性全波整流式ACDC转换器的电路图如22所。交流电压满量程为200mV(有效值)现利用单运放TI61(IC1)与二极管T、D2组成平均值响应的线性整流电路,能消除二极管在小信号整流时所引起的非线性电压,使输出的平均值电压U与ACDC转换器的输入电压UN(有效值)呈线行关系,适合测量40~400Hz的正弦波,测量准确度优于1%。当频率超过400H时,测量误差会增大。电路中的R是T061同相输入端电阻。R2与R3为负反馈电阻,可将IC接成同相放大器。C1、C2为隔直电容TH(UM=20m)10OkC1L, NL01 47uU o R7 1MIN+160.02217106UD2 ILCD. 8K00k3K32RPCOM1D3R6200187K图22 AC/DC转换器的电路comFig 2-2 The circuit of the AC/DC Converters需要指出,该电路属于输出不对称式线性全波整流电路,在正、负半周时的等效电路及整沆输出波形如图23所示。正半周时电压放大倍数K>222(半波整流时正弦波的有效值与平均值的关系为UR=2.22U0);负半周时Kr=1,它相当于电压跟随器。具体讲,在正半周时v1导通,D2截止,IC1输出电流的途径是C1→VD1→R4→R6一RP→COM(地),并终过R3对C3充电。此时式中R电位器RP的电阻值。将R4=3k2,、R6=1,87k2、R2p=0~2002代入上试得到K=2.6~245>2.22。负半周时,VD2导通,V1截止,电流途径变成COM→RP→R6→D2→C1→C1,此时K=1。由R和IClRI[C1o UoR4VD?图2-3等效电路及输出波形Fig 2-3 Equivalent circuit and the output waveformC组成的平滑滤波器可滤除交流纹波,高频千扰信号则被由R、C构成的高频滤波器所滤掉,从而获得了稳定的平均值电压,再通过312位单片AD转换器IC2(ICL7106)完成数/模转换,驱动LCD显示出测试结果。图2-2中的阴影区表示连接AD转换器与LCD的导电橡胶条。该电路能消除整流管的非线性误差。RP是校准交流电压的电位器,调整RP可使仪表直接显示出被测电压的有效值。C是运放IC的频率补偿电容。R2和C4还向VD2提供偏压,以减小TL061对小信号放大时的波形失真。TL061的电源亦可取自9V电源。上述ACDC转换器适配各种31/2~412位单片AD转换器,并可将LCD改成LED显示器。设计交流电压挡(ACV)时,还应在ACDC转换器的输入端接上如图22中所示的精密电阻分压器R1~R222简易平均值AC①C转换器简易平均值ACDC转换器的电路图2-4所示。由于该电路末使用运算放大器及电位器,因此电路简单,不需要调整。两个ACV挡分别为200V、750V(RMS)。VD为整流管,VD2为保护二极管。R1为输入端电阻,仪表输入阻抗∠≈R=R1+R2+R32=4.51M。C1为隔育电容。正半周时四导通,VD2截止,做半波整流;负半周时T1截止,四D2导通,由VD2给电流提供泻放回路。整流后的脉动直流经C2滤波,获得平均值电压Uo。R2和R3为滤波器312位数字万用表设计负载,兼作750V拦的分压器,可将U再衰减10倍。ACⅤ挡的测量准确度可达±1.2%~士15%,误差略高于线性整流电路。D和V2应采用N4004型1A400ⅴ的硅整流管,以便承受较高的反向电压。对半波整流而言,正弦波电压平均值与有效值的关系为U=045Uw。巧妙地利用电阻分压器可使仪表直接显示被测电压有效值。不难验证,对于200V挡,若UN=2000V(RMS),则Jl=0.45U/m=0.45×200.0V=90V10×103=0R2+R3=90My200. 0mvR1+R2+R24.51×10°1 CI VDI200VIN+4.5M0.1μR27106750VU.F200mACvLCDVD2本Tc2IN4004Ou hR30.022COMO1KCOM图24简易平均值ACDC转换器电路Fig, 2-4 The circuit of simple average of ac/ dc converterarm对于750V挡,若U,=750V(RMS),则R1×10U=0.45U,m337,5mⅤ=75.0mVR,+rtr4.5×10只要改变小数电位置,即可使750V挡直接显示出U值。具体方法是去掉小数点后仍用200mV基本表测量U,并将显示单位取V,这样就把75.0mV变换成750V。223IU转换器数字万用表的直流电流挡(DCA)一殷设置4挡:2nA、20mA、200mA、20A,IU转换器的电路图2-5所示。其中20A挡专用个输入插孔。被测电流经过分流器可转换成电压信号。分流器由R~R组成,总电阻为100g2。其中,R1和R2采用精密金属膜电阻,R3
    2020-12-08下载
    积分:1
  • c#ribbon界面全开源控件.zip
    【实例简介】全开源的最新的ribbon控件,C#可以免费使用
    2021-11-22 00:42:12下载
    积分:1
  • 清华大学郑莉C++课件 PPT及例源码 参考
    包括PPT,及例题源码,及实验程序 绝对的正确,不对找我
    2020-12-05下载
    积分:1
  • 数据可视化的基本原理与方法.pdf
    数据可视化的基本原理与方法.pdf
    2020-03-07下载
    积分:1
  • modelsim-gcc-4.5.0-mingw64(for 64位windows)
    支持win64的modelsim,questasim的gcc编译器,可以在64位windows环境下编译UVM的库。
    2020-12-11下载
    积分:1
  • S变换——Matlab(S变换函数,个例子)
    S变换——Matlab(S变换函数,一个例子)
    2020-06-20下载
    积分:1
  • 教务管理系统(c#)完整代码+数据库
    教务管理系统(c#)完整代码+数据库教务管理系统(c#)完整代码+数据库教务管理系统(c#)完整代码+数据库
    2020-11-27下载
    积分:1
  • 用labview设计的虚拟电子电压表(有效值、峰值、平均值)
    用labview设计的有效值电压表,均值电压表,峰值电压表设计简单明了,可以在此基础上修改输入项,就可以和采集卡等硬件连接了
    2021-05-07下载
    积分:1
  • 风控建模等奖
    使用拍拍贷数据,建模全过程,从数据预处理开始到最后的模型比较。仅用于交流学习。队伍介绍队名“不得仰视本王”,队伍由五个小伙伴组成,我们是在一个类以的比赛(微额借款用户人品预测大赛)认识的,对数据挖掘竹热爱让我们走到了一起,以下是成员简介:姓名学校、学历比赛经历匚陈靖」中国科学技术大学研二天泡科学家总分第三,微额借贷用户人品预测大赛季军朱治亮浙江大学研二淘宝穿衣搭配比赛李军,微额借贷用户人品预测大赛李军质耀重庆邮电大学研二微额借贷用户人品预测大赛冠军匚赵蕊」重庆邮电大学研微额借贷用户人品预测大赛亚军黄伟鹏北京大学研一微额借贷用户人品预测大赛冠军解决方案概述2.1项目介绍与问题分析拍拍贷“魔镜风控系统”从平均400个数据维度评估厍户当前的信用状态,给每个告款人打出当前状态的信用分,在此基础上再结合新发标的信息,打出对于每个标约6个月内逾期率的预沨,为没资人提供关键的决策依据。本次竞赛目标是根据用户历史行为数据来颈测用户在六来6个月内是否会逾期还款的概率。问题转换成2分类问题,评估指标为AUC,从 Master, LogInfo, Update Info表中构建恃征,考虑评估指标为AUC,其本质是排序优化问题,所以我们在模型顶层融合也使用基于排序优化的 RANK AVG融合方法。2.2项目总体思路本文首先从数据清洗开始,介绍我们对缺失值的多维度处、对离群点的剔除方法以及对字符、空格等的处理;其次进行特征工程,包括对地理位置信息的特征构建、成交玉间特征、类别特征编码、组合特征构建、 Lpdatelnfo和 Log Info表的特征提取等;再次进行特征选择,我们采用了 boost, boost的训练过栏即对特征重要性的排序过程;然后处理类别的不平衡度,由于赛题数据出现了类不平衡的情况,我们采用了代价敏感学习和过采样两和方法,重点介绍我们所使用的过采样方法;最后一部分是模型设计与分析,我们采用了二业界广泛应用的逻辑回归模型、数据挖掘比赛大杀器 ghost.,创新性地揆索了large- scale sⅧm的方法在本赛题二的应用,玟得了不错的效果,此外还介绍了模型融合方、数据清洗3.1缺失值的多维度处理在征信领域,用户信总的完善程度可能会影响该层户的信用评级。一个信息完苦程度为100%的户比起完善程度为50%的用户,会更加容易官核通过并得到借款。从这一点亡发,我们对缺失值进行了多维度的分析和处理按列(属性)统计缺失值个数,进一步得到各列的缺失比率,下图(图1)显示了含有缺失值的属性和相应的缺失比率sing rate of Attributes图1.属性缺失比枣WeblogInfo_1和 WeblogInfo3的缺失值比率为97%,这两列属性基本不携带有用的信息,直接剔除。 Uscr Info_11、 Userinfo_12和 Uscr info_13的缺失值比率为63%,这三列属性是类别型的,可以将缺失值用-1垣充,相当于“是否缺失”当成另一种类别。其他缺失值比卒较小的数值型属性用中值填充按行统计每个样本的属性缺矢值个数,将缺失值个数从小到大排序,以序号为横坐标,缺失值个数为纵坐标,画出如下散点图(图2)test set16016014014C12012Cw9mczE100400060008000Order Numbe(sort ircreasinglyOrde Nt mber(sort increasing ly)图2.样本属性缺失个数对比 trainset和 testset上的样本的属性缺失值个数,可以发现其分有基本一致,但是trainset上出了几个缺失值个数特别多的样本(红框区域内),这几个样本可以认为是离群点,将其剔除另外,缺矢值个数可以作为一个特征,衡量用户信息的完善程度。3.2剔除常变量原始数据宁有190维数值型特征,通过计算每个数值型特征的标准差,剔除部分变亿很小的特征,下表(表1)列出的15个特征是标准差接近于0的,我们剔了这15维特征表1.剔除数值特征标准差属性标准差属性标准差属忾标准差Webloglnfo_10 0.0707 WeblogInfo_41 0.0212 Webloglnfo_490.0071Webloglnfo_23.0939 WeblogInfo_43 0.0372 Webloglnfo_5200512Webloglnfo_31.0828 Webloglnfo_44.0166 Webloglnfo_5400946Webloglnfo_32 0.0834 Webloglnfo_46.0290 WeblogInfo_5500331Webloglnfo_40.0666 Webloglnfo_47 0.0401 WeblogInfo_58006093.3高群点剔除在样本空间中与其他样本点的一般行为或特征不一致的点称为离群点,考虑到离群点的异常特征可能是多维度的组合,我们通过分析样本属性的缺矢值个数,剔除了极少量的离群点(见3.1节)此外,我们还采用了另外一种简单有效的方法:在原始数捶上训练ⅹ gboost,用得到的xgb模型输出特征的重要性,取最重要的前20个特征(如图3所示),统计每个栏本在这20个特征上的缺失值个数,将缺矢值个数大于10的样本作为离群点。ThrciParty Ifn PeriodIntrAparty nto HerodThrcPorty hfo Penod3ardiParty hfo Period?ThirdParty Info Penod图3.Xgb特征重要性通过这个方法,易除了400多个样水。这些样在重要特征上的取值是缺失的,会使得模型学习变得因难,从这个角度妖说,它们可以看成是离群点,应剔除掉。3.4其他处理(1)字符大小写转换Userupdate Info表宁的 Userupdate Info1字段,属性取值为英文字符,包含了大小写,如Q"和”qQ",很玥显是同一和取值,我们将所有字符统一转换为小写(2)空格符处理Mastor表中 UserInfo9字段的取值包含了空格字符,如“中国移动”和“中国移动”它们是同一种取值,需要将空格符去除。(3)城市名处理Userinfo_8包含有“重庆”、“重庆市”等取僬,它们实际上是同一个城市,需要把字符中的“市”全部去掉。去掉“市”之后,城市数由600多下降到400多。四、特征工程4.1地理位置的处理对地理位置信(类别型变量)最简单的处理方式是独热编码(one- hot encoding),但是这样会得到很高维的稀疏特征,影响糢型的学习,我们在独热编码旳基础上,做了特征选择。下面介绍具体的方法。赛题数据提供了用户的地挛位置信息,包括7个字段: Userinfo2、 Userinfo4、UserInfo7、 UserInfo8、 UserInfo I9、 UserInfo20,其中 UserInfo_7和 UserInfo19是省份信息,其余为城市信息。我们统计了每个省份和城市的违约率,下图以 Userinfo_7为例图1.省分违约率可视化图5可视化了每个省份的违约率,颜色越深代表违约率越大,其中违约率最大的几个省份或直辖市为四川、湖南、湖北、吉林、天津、山东,如下图所示:图5.违约深突出省份可视化因此我们可以构建6个二值特征:“是否为四川省”、“是否为湖南省”...“是否为山东省”,其取值为或1。其实这相当于对地理位置信息做了独热编码,然后保留其中有判别性的菜些列。这里 UserInfo_7何含32和取值,编码后可以得到32维的稀疏特征,而我们只保留其宇的6维以上我们是通过人工的分析方法去构延二值特征,在处理省份信息时还是匕较直观的,但是处理城市信息,比如 Userinfo2,包含了33个减市,就没有那么直观了。为了得到有判别性的二值特征,我们首先对 Userinfo2进行独热编码,得到333维的二值特征,然后在这333维稀疏特征上训练ⅹgb模型,再根据xgb输出的特征重要性刷选二值痔征,以下是选取到的部分二值特征(对应的城市):“淮纺市”、“九江市”、“三门峡市”、“汕头市”、“长春市”、“铁岭市”、“济菊市”、“成都市”、“淄博市”、“牡丹江市”。按城市等级合并类别型特征取值个数太多时,独热编码后得到太高维的稀疏特征,除了采用上面提到的特征选择方法外,我们还使用了合并变量的方法。按照城市等级,将类别变量合并,例如线城市北京、上海、广州、深圳合并,赋值为1,同样地,二线城市合并为2,三线城市合并为3>经纬度特征的引入以上对地理位置信息的处理,都是基于类别型的,我们另外收集了各个城市的经纬度,将城市名用经纬度替换,这样就可以将类别型的变量转化为数值型的变量,比如北京市,用经纬度(39.92,116.46)替换,得到北纬和东经两个数值型特征。加入经纬度后,线下的cross validation有千分位的提升。城市特征向量化我们将城可特征里的城市计数,并取Log,然后等值离散化到610个区间内。以下图为例,将 serino2这个特征里面的325个城市离散为一个6维向量。向量“100000”表示该城位于第一个区间。线下的 cross validation有千分位的提升。Loglui2 num)6.城市特征离散化地理位置差异特征如图8所示,1,2,1,6列郗是城市。那么我们构建一个城市差异的特征,比妇diff_12表示1,2列的城市是否相同。如此构建 diff l2,diff_14,diff_l6,diff_24,diff26,diff46这6个城市差异的特征。线下的 cross validation有千分位的提升。⊥aJse⊥nfa2 userinfo4 Userinfo7 Userinfo8 Userinfo19uer⊥nf。201C013郴州1C020惠州1C033零1c035深圳东东东东建东福建省10038济104连云港远言港带1C042德州1c043青岛聊拔东自聊城市46深圳汕广东广东省汕尾市105所多工新乡图7.地理位置差异样例4.2成交时间特征按日统计训练集中每天借贷的成交量,正负样本分别统计,得到如下的曲线图8,横坐标是日期(20131101至20141109),纵坐标是每天的借贷量。蓝色由线是违约的样本每天的数量(为了对比明显,将数量乘上了2),绿色曲线对应不违约的样本train set1200count o10008004002广外从20030350Date20131101~20141109图8.每日借贷量统计可以发现拍拍贷的业务量总体是在埤长的,而违约数量一开始也是缓慢增长,后面基本保持不变,总体上违约率是平稳甚至下降的。在横坐标300~350对应的日期区间,出现了些借贷量非鸴大的时间苄点,这些可能隐减着苿些信息,我们尚未挖掘出来。考虑到违约率跟时间线有关,我们将戒交时间的字段 Listinginfc傲了几种处理,一和是直接将其当做连续值特征,也就是上图对应的横坐标,另一和是离散化夂理,每10天作为一个区间,乜就是将日期0`10离散化为1,日期1120离散化为2.4.3类别特征的处理除了上面提到的对菜些类别特征进行特殊处理外,其他类别特征都做独热编码。44组合特征Xgboost的训练完成后可以输出特征的重要性,我们发现第三方数据特征ThirdParty Info Period XX”的 feature score比较大(见图3),即判别性比较高,于是用这部分特征构建了ξ合特征:将特征两两相除得到7000个特征,然后使用 boost对这7000多个特征单独训练模型,训练完成后得到特征重要性的排序,取其中top500个特征线下cv能达到0.73+的AUC值。将这500个特征添加到原始特征体系中,线下cv的AC值从0.777捉高到0.7833。另外,也组合了乘法特征(取对数):10g(x*y),刷选出其中的270多维,加入到原始特征休系中,单模型cv又提高到、0.785左右。4.5 Upadte Info表特征根据提供的修改信息表,我们从中抽取了用户的修改信息特征,比如:修改信息次数,修改信息时间到成交时间的跨度,每和信息的修改次数等等特征。46 LogInfo表特征类似地,我们从登录信息表里提取了用户的登录信息特征,比如登录天数,平均登录间隔以及每种操作代码的次数等47排序特征对原始特征中190维数值型特征接数值从小到大进行排序,得到190维排序特征。排序特征对异常数据有更强的鲁棒性,使得模型更加稳定,降低过拟合的风险。五、特征选择在特征工程部分,我们构建了一系列位置信息相关的特征、组合特征、成交时间特征、排序特征、类别稀疏侍征、 updateinfo和1 oginfo相关的特征等,所有特征加起来将近1500维,这么多维特征一方面可能会导致维数灾难,另一方面很容易导致过拟合,需要做降维处理,降维方法赏用的有如PCA,tSNE等,这类方法的计算复杂度比较高。并且根据以往经验,在数据挖掘类的匕赛中,PCA或t-SNE效果仨往不好。除了釆用降维算法之外,也可以通过特征选择来降低特征维度。特征选择的方法很多:最大信息系数(MIC)、皮尔森相关系数(衡量变量间的线性相关性)、正则化方法(L1,L2)、基于模型的特征排序方法。比较高效的是最后一种,即基于学习模型的特征排序方法,这种方法有一个好处:模型学习的过程和特征选择的过程是同时进行的,医此我们采用这和方法,基于 boost来做特征选择, xgboost模型洲练完成后可以输岀特征的重要性(见3.3图),据此我们可以保留TopN个特征,从而达到特在选择的目的。
    2020-06-23下载
    积分:1
  • 最完整的qq参赛作品
    东西超好,里面代码,文档非常全,分服务器,客户端,绝对适合学习学习,请勿传播,后果自负
    2020-11-29下载
    积分:1
  • 696516资源总数
  • 106914会员总数
  • 0今日下载