Saturday Samedi May 25 Mai 2019 - Seventh Canadian Statistics Student Conference Septi eme Congr es Canadien des Etudiants en Statistique
←
→
Page content transcription
If your browser does not render page correctly, please read the page content below
Seventh Canadian Statistics Student Conference • Septième Congrès Canadien des Étudiants en Statistique University of Calgary, Alberta Saturday • Samedi May 25 • Mai 2019
HRIC Atrium P10 TRW HRIC HMRB P6 PP MT HSC P7 FMC P8 WHC P4 NT P8a SSB P1 ST Public P1, P3, P4, P6, P8a, P10 (underground) P3 Staff P7, P8, TRW (underground) ST SOUTH TOWER T SSB SPECIAL SERVICES BUILDING B TBCC TOM BAKER CANCER CENTRE C FMC FOOTHILLS MEDICAL CENTRE NT NORTH TOWER WHC WOMEN’S HEALTH CENTRE HSC HEALTH SCIENCES CENTRE HMRB HERITAGE MEDICAL RESEARCH BUILDING HRIC HEALTH RESEARCH INNOVATION CENTRE TRW TEACHING RESEARCH & WELLNESS MT MCCAIG TOWER PP PHYSICAL PLANT FOOTHILLS CAMPUS MAP
Windows Elevator“h" Foothills Hospital 1508 1506 1504 1509A 1509 1503 O’Brien Centre 1402 1403 1404 Corridor 14022 1501 Elev ator 1408X Bioinformatics Lab Serv ice Shaft 1450V 1405B 1405A 1500 Health Sciences Library Serv ice Shaft 1452V Theatre 4 Service Stairs to Serv ice Shaft O’Brien Centre, (1st/2nd floors), 1454V Theatres 3 & 4, Room 1405B Main Level Serv ice Shaft 1456V To HRIC & Theatre 3 Theatre 4 Serv ice Shaft 1460V Serv ice Shaft 1462V 4 Health Sciences Library 4 Theatre 3 4 Serv ice Shaft 1484V 1464A 1462B 146 4B Serv ice Shaft 1479V 1st Floor
Contents • Table des matières Welcome • Bienvenue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 Sponsors • Commanditaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 Organizers and volunteers • Organisateurs et bénévoles . . . . . . . . . . . . . . . . . . . . 10 Program Overview . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 Aperçu du programme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 Keynote address • Discours d’honneur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 Statistical Computing Workshop • Atelier en Calculs Statistiques . . . . . . . . . . . . . . 15 Machine Learning applications in R Applications de l’apprentissage machine en R . . . . . . . . . . . . . . . . . . . . . . 16 Invited career speakers • Conférenciers invités à la séance sur les carrières . . . . . . . . . 17 Scientific abstracts: Oral presentations • Résumés scientifiques: présentations orales . . . . 20 Applications . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 Robust estimators • Estimateurs robustes . . . . . . . . . . . . . . . . . . . . . . . . 23 Causal inference • Inférence causale . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 Model selection • Sélection de modèle . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 Bayesian statistics • Statistique Bayesienne . . . . . . . . . . . . . . . . . . . . . . . . 31 Biostatistics • Biostatistique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 Scientific abstracts: Posters • Résumés scientifiques: Posters . . . . . . . . . . . . . . . . . 37 3
Welcome • Bienvenue We are pleased to have you at the Canadian Nous sommes heureux de vous compter parmi Statistics Student Conference! nous au Congrès canadien des étudiants en Our main goal is to offer a space for students statistique (CCÉS)! Nous visons principale- and recent graduates to network, learn, and ment à offrir aux étudiants et aux nou- participate in multiple activities that can help veaux diplômés un espace leur permettant them consolidate the direction of their pro- de réseauter, d’apprendre, et de participer fessional path. The CSSC provides a low- à de multiples activités susceptibles de les stress environment for sharing ideas, devel- aider à consolider l’orientation de leur par- oping skills and holding discussions with oth- cours professionnel. Le CCÉS offre un envi- ers about research, while learning about ca- ronnement sans stress pour partager des idées, reer opportunities. What is best, a wide développer des compétences et discuter de range of statistical interests are represented, recherche avec des pairs, tout en en apprenant such as biostatistics, industrial statistics; big davantage sur les possibilités de carrière. Qui data analysis; probability theory, Bayesian mieux est, un large éventail d’intérêts statis- approaches, and more. tiques sont représentés, tels que la biostatis- This year’s event will put the spotlight on tique, la statistique industrielle, l’analyse de Machine Learning and Big Data, with a talk données volumineuses, la théorie des proba- about machine learning applications in R and bilités, les approches bayésiennes et plus en- an interactive workshop opposing machine core. L’événement de cette année mettra en learning and logistic regression for big data. lumière l’apprentissage machine et les données Attendees are encouraged to bring their lap- volumineuses, grâce à une présentation sur les tops to the workshop. The program also in- applications d’apprentissage machine en R et cludes a session with representatives from dif- à un atelier interactif opposant l’apprentissage ferent areas of the statistics workforce, aim- automatique et la régression logistique pour ing to provide career advice to graduates and les données volumineuses. Nous encourageons recent graduates; as well as multiple sessions les participants à apporter leur ordinateur dedicated to showcase students’ research work portable à l’atelier. Le programme inclut through talk and poster presentations. également une session avec des représentants Finally, the keynote speaker, Dr. Char- de différents secteurs de la statistique, dans maine Dean from the University of Water- le but de fournir des conseils de carrière aux loo, will talk about Interdisciplinary work and diplômés et aux nouveaux diplômés. Il com- being successful as a leader in the field of porte aussi plusieurs sessions qui mettront en statistics. valeur le travail de recherche des étudiants, par l’intermédiaire de présentations orales et par affiche. 4
Sponsors • Commanditaires Special thanks to all our sponsors who have Nous tenons à remercier chacun de nos com- provided generous support for the various manditaires pour leur généreuse contribu- activities of the Canadian Statistics Student tion au Congrès Canadien des Étudiants en Conference. These contributions have made Statistique. C’est grâce à eux que la tenue this event possible. de ce congrès est possible. Gold Sponsors • Commanditaires Or https://math.ucalgary.ca 5
Organizers and volunteers • Organisateurs et bénévoles Organizing committee • Comité organisateur Co-chairs / Co-présidentes: Ms. Anita Brobbey (University of Calagary) Ms. Myrtha Reyna (University of Toronto) Local arrangements / organisation locale: Ms. Fahmida Yeasmin (University of Calgary) Mr. Charles Sam (University of Calgary) Fundraising / Collecte de fonds: Mr. Thai-Son Tang (University of Toronto) Ms. Melissa Van Bussel (Trent University) Ms. Lin Ling (University of Toronto) Translation / Traduction: Mr. Luc Villandre (McGill University) Mr. Steve Ferreira (McGill University) Ms. Marie-Christine Robitaille Grou (Université de Montréal) Skills session / Séance sur les compétences techniques: Mr. Olawale Fatai Ayilara (University of Manitoba) Mr. Jacob Prosser (University of New Brunswick) Carrer session / Séance sur les carrières: Ms. Afaf Alzahrani (Dalhousie University) Mr. Sudipta Saha (University of Toronto) Scientific Program / Programme scientifique: Ms. Michela Panarella (Univeristy of Toronto) Ms. Victoire Michal (Université de Montréal) 10
Support and thanks • Support et remerciements SSC President / Président de la SSC: Robert Platt SSC Administrative assistant / Adjoint Administrative de la SSC: Miaclaire Woodland SSC Executive assistant / Assistant exécutif de la SSC:: Michelle Benoit SSC Treasurer / Trésorier de la SSC: Edward Chen SSC Local organizers / Organisateurs locaux: Karen Kopciuk, Alexander de Leon SSC meetings coordinator / Coordonnateur des congrès: Changbao Wu Photographer / Photographe: Peter Macdonald Volunteers / Bénévoles: Shakiru Alaka, Sarath Kumar Jayaraman, Mohammed Mujaab Kamso, Mili Roy, Oluwaseyi Adetutu Lawal, and Ayoola Ademola. Judges / Juges: Special thanks to the judges involved in the assessment of abstracts, talks and poster presentations. 11
Program Overview Date and times: Saturday, May 25th, from 07:30 to 20:30. Location: Health Science Centre. Cumming School of Medicine, University of Calgary. Time Session Room Page Registration 07:30-08:30 HRIC atrium Breakfast 08:30-08:45 Presidential address Theatre 4 Student research talks I Applications Theatre 4 20 08:50-09:35 Robust estimators O1500 23 Causal inference 1405B 26 Student research talks II Biostatistics Theatre 4 29 09:40-10:25 Bayesian statistics O1500 31 Model selection 1405B 34 10:25-10:45 Coffee break HRIC atrium Skills session 10:45-11:55 Theatre 4 16 Machine Learning applications in R 11:55-12:10 Sponsor Talk Theatre 4 Lunch 12:10-13:20 HRIC atrium Poster session (starts at 12:40) 37 Workshop 13:20-14:45 Theatre 4 15 Exploring Machine Learning Classification Methods Using R 14:45-15:00 Coffee break HRIC atrium 15:00-16:00 Career panel Theatre 4 17 Keynote speech 16:00-17:15 Interdisciplinary Work and being successful as a leader Theatre 4 14 in this arena 17:15-18:00 Closing and awards Theatre 4 18:00-21:00 Social Evening Social evening A limited quantity of food and beverages will be available at no additional cost. Address & time • Adresse & heure: The Den 18:00 hrs. MacEwan Student Centre, 2500 University Drive NW, Calgary, AB. (http://den.su.ucalgary.ca) 12
Aperçu du programme Date et plage horaire: Samedi 25 mai de 07h30 à 20h30. Lieu: Health Science Centre. Cumming School of Medicine, Université de Calgary. Heure Séance Salle Page Inscription 07:30-08:30 HRIC atrium Petit-déjeuner 08:30-08:45 Adresse présidentielle Theatre 4 Présentations orales étudiantes I Applications Theatre 4 20 08:50-09:35 Estimateurs robustes O1500 23 Inférence causale 1405B 26 Présentations orales étudiantes II Sélection de modèle Theatre 4 29 09:40-10:25 Statistique bayesienne O1500 31 Biostatistique 1405B 34 10:25-10:45 Pause-café HRIC atrium Session de formation 10:45-11:55 Theatre 4 16 Applications en R de l’apprentissage machine 11:55-12:10 Présentation du sponsor Theatre 4 Lunch 12:10-13:20 HRIC atrium Séance d’affiches (débute à 12:40) 37 Atelier statistique 13:20-14:45 Exploration de méthodes de classifications en apprentissage Theatre 4 15 machine sur R 14:45-15:00 Pause-café HRIC atrium 15:00-16:00 Table ronde des carrières Theatre 4 17 Présentation d’honneur 16:00-17:15 Travail interdisciplinaire et réussir en tant que leader Theatre 4 14 dans cette aréna 17:15-18:00 Clôture et remise des prix Theatre 4 18:00-21:00 Soirée Soirée Une quantité limitée de nourriture et de boissons sera disponible sans frais supplémentaires. Adresse & heure: The Den 18:00 hrs. MacEwan Student Centre, 2500 University Drive NW, Calgary, AB. (http://den.su.ucalgary.ca) 13
Keynote address • Discours d’honneur Charmaine Dean est vice-présidente - Recherche et Charmaine Dean is Vice- International à l’Université de Waterloo. Dans le President, Research and In- cadre de ses fonctions, Dre Dean vise à encour- ternational at the University ager les collaborations, et à agir comme liaison en- of Waterloo. Her focus is on tre portfolios externes, partenaires industriels et en- building upon foundational trepreneurs. Les travaux de Charmaine Dean dans strengths to heighten the em- le domaine de l’analyse spatiotemporelle appliquée à phasis on collaborations, and la santé et à la foresterie lui ont valu plusieurs prix. link related external portfo- En 2003, Dre Dean s’est vue décerner le prix CRM- lios in a systematic approach SSC en statistique, en reconnaissance d’une contribu- to industrial partners and en- tion substantielle à la discipline au cours des quinze trepreneurship. Dr. Dean’s années suivant l’obtention du doctorat. En 2007, work in space-time analytics elle a remporté le ”Mathematics Alumni Achieve- for health and forestry has ment Medal” de l’Université de Waterloo. En 2010, been recognized widely: in elle a été nommée Fellow de l’Association américaine 2003, she was awarded the CRM-SSC prize; in 2007 pour l’avancement des sciences. En 2012, elle a été named Fellow of the American Statistical Associa- lauréate du ”Trinidad & Tobago High Commission tion and awarded the University of Waterloo Math- Award”. Enfin, en 2016, elle a été élue membre du ematics Alumni Achievement Medal; in 2010 named International Statistical Institute. Fellow of the American Association for the Advance- ment of Science; in 2012 awarded a Trinidad & To- Résumé scientifique bago Canadian High Commission Award; and in 2016 elected to the International Statistical Institute. Résoudre les problèmes sociétaux auxquels nous Abstract sommes confrontés, du développement durable aux Solving many complex societal problems facing the changements climatiques, de la compréhension des world, from sustainable development to climate catastrophes naturelles à celle des problèmes de change to understanding natural disasters and global santé mondiale, requiert souvent une approche in- health problems, often involves an interdisciplinary terdisciplinaire. Les statisticiens jouent un rôle cru- approach. Statisticians have an important role to cial dans l’élaboration de solutions, en raison de play in contributing to solutions because of our leur prééminence dans le développement d’outils leadership in developing tools for evidence-based pour la prise de décisions basée sur des données decision-making. Additionally, we are well poised probantes. Le développement de nouveaux outils to pull together interdisciplinary teams because gen- statistiques pour résoudre un problème scientifique erally our work is interdisciplinary in nature. For nécessite notamment une compréhension de la sci- example, developing new statistical tools to solve a ence au coeur du problème. La recherche interdisci- scientific problem requires that we understand the plinaire a souvent des répercussions sociétales con- science surrounding the problem. Interdisciplinary sidérables. Elle est également très bénéfique aux research is often of high societal impact and gives re- chercheurs eux-mêmes, qui se voient exposés à une searchers valuable exposure to a diversity of research variété de concepts, d’outils et de méthodologies al- concepts, tools and methodologies beyond their own lant bien au-delà de leur propre discipline. Quels discipline. What are the key ingredients for creat- sont les ingrédients indispensables pour créer un ing a successful, innovative and productive interdis- environnement interdisciplinaire novateur, productif ciplinary environment? What qualities make for suc- et propice au succès? Quelles qualités assurent la cess in this environment and what challenges may réussite dans cet environnement et quels défis peu- hinder success? What are the skills that a leader of vent mener à l’échec? Quelles sont les aptitudes dont a multi-disciplinary team needs? What makes inter- a besoin le dirigeant d’une équipe multidisciplinaire? disciplinary work fun and exciting? How can you be Qu’est-ce qui rend le travail interdisciplinaire amu- a confident contributor around an interdisciplinary sant et excitant? Comment peut-on bien contribuer table of experts? This talk considers these questions, aux travaux d’un comité interdisciplinaire d’experts? providing examples to illustrate best practices in col- Cette présentation aborde ces questions, et fournit laborative training and research environments. des exemples illustrant les meilleures pratiques dans des environnements de formation coopérative et de 14 recherche.
Statistical Computing Workshop • Atelier en Calculs Statistiques Brendan Cord Brendan Cord Lethebe est un chercheur Lethebe is an expe- aguerri à l’Université de Calgary. Il rienced researcher est également le responsable des méthodes in University of Cal- et des analyses au sein de l’unité de gary. He is also the recherche clinique au Cumming School of methods/analytics Medicine de l’Université de Calgary. Il lead of the clinical détient un baccalauréat en science actuar- research unit at the ielle ainsi qu’une maı̂trise en biostatistique. Cumming School of Il se concentre surtout sur la biostatistique, Medicine at University of Calgary. He holds mais il est également doué en modélisation a Bachelor in Actuarial Science (University mathématique, R, SQL, Python et STATA. of Calgary) and a Masters in Biostatistics (University of Calgary). He is mostly Résumé scientifique focused in Biostatistics and is skilled in La capacité d’ajuster adéquatement des Mathematical Modelling, Biostatistics, R, modèles d’apprentissage machine est de plus SQL, Python, STATA and Clinical Research. en plus importante pour les statisticiens. À l’aide d’un jeu de données public, nous Abstract nous concentrerons sur un modèle de clas- Being able to properly fit machine learning sification supervisée et sur des techniques models is becoming an important skill for optimales pour la sélection de paramètres. those in the statistical community. Using a Par l’intermédiaire de librairies R com- publicly available dataset we will focus on munes, nous aborderons la régression lo- supervised classification models, and tech- gistique LASSO, les forêts aléatoires, les niques for optimal parameter selection. We réseaux de neurones, ainsi que de multi- will explore the LASSO logistic regression, ples algorithmes pour les arbres de décision. various decision tree algorithms, random for- Ceci nous permettra de bien distinguer les est, and neural net using popular R pack- avantages et les inconvénients d’utiliser un ages. This will allow us to clearly see the modèle interprétable plutôt que des algo- advantages and disadvantages of using inter- rithmes ”boı̂te noire”. pretable models vs “black-box” algorithms. 15
Machine Learning applications in R Applications de l’apprentissage machine en R Prof. Tom Loughlin est directeur du Tom Loughin is a département de statistique et de science ac- professor and chair tuarielle à l’Université Simon Fraser (SFU) à of the Department Burnaby, Colombie-Britannique. Il a obtenu of Statistics and son doctorat en statistique de la Iowa State Actuarial Science at University et a passé treize ans à Kansas Simon Fraser Uni- State University avant de rejoindre SFU en versity in Burnaby, 2006. Ses intérêts de recherche recoupent British Columbia, plusieurs champs d’applications statistiques Canada. He got et de développement méthodologique. Il his PhD in Statis- s’est penché notamment sur l’apprentissage tics from Iowa statistique, la modélisation de données State University catégoriques, la conception et l’analyse and spent 13 years d’expériences, ainsi que sur les statistiques at Kansas State sportives. Il a publié un livre intitulé ”Anal- University before moving to SFU in 2006. ysis of Categorical Data with R”, co-écrit par Tom has broad research interests in many Chris Bilder et disponible chez CRC Press. areas of statistical application and method Tom a une longue expérience en tant que con- development, including statistical learning, sultant statistique et possède l’accréditation modeling categorical data, design and PSTAT de la American Statistical Associa- analysis of experiments, and statistics in tion (ASA) et de la Société statistique du sports. He has published a book, ”Analysis Canada (SSC). Il est également Fellow de of Categorical Data with R,” co-authored l’ASA. with Chris Bilder and available from CRC Press. Tom has extensive experience as a statistical consultant and has PSTAT accreditation from both the ASA and the Statistical Society of Canada. He is also a Fellow of the ASA. 16
Invited career speakers • Conférenciers invités à la séance sur les carrières Dominique Ibañez Dominique est titulaire d’une maı̂trise en bio- Dominique gradu- statistique de l’Université de Toronto. Elle ated with a Master’s s’est jointe à la Direction des aliments de degree in Biostatis- Santé Canada il y a quatre ans. Elle est tics from the Univer- arrivée avec 25 ans d’expérience en analyse sity of Toronto. She statistique en milieu clinique, principalement joined the Health en recherche en rhumatologie. Elle a plus Canada’s Food Di- de 90 articles évalués par des pairs à son ac- rectorate four years tif. Elle dirige maintenant une équipe de dix ago. She arrived statisticiens. Sous sa direction, de nouvelles with 25 years of normes ont été introduites pour améliorer les experience conduct- performances. Celles-ci incluent: le men- ing statistical analy- torat du nouveau personnel par des person- sis in a clinical en- nes plus expérimentées, des forums de discus- vironment – primar- sion mensuels sur les statistiques, une plus ily in Rheumatology research. She has over grande attention portée à la recherche statis- 90 peer-reviewed articles to her credit. She tique ainsi qu’à la création de liens avec now leads a team of 10 statisticians. Un- les chercheurs universitaires en nutrition à der her leadership, new standards have been travers le Canada. Son équipe a prodigué une introduced to improve performance. Some expertise statistique dans le cadre de projets of these include: mentoring of new staff by clés menés à la Direction des aliments, tels more experienced ones, monthly statistical que la réduction de la teneur en sodium des discussion forums and greater focus on sta- aliments, les évaluations précédant la mise en tistical research as well as outreach to aca- marché, et la présence de salmonelle dans le demic nutrition researchers across Canada. poulet. Her team has been involved in providing sta- tistical expertise and analysis in key projects conducted in the Food Directorate such as Sodium Reduction in Canada, pre-market evaluations and Salmonella in Chicken. 17
Lisa Lix Dre Lisa Lix est professeure de biostatis- Dr. Lisa Lix tique et titulaire de la Chaire de recherche is Professor of du Canada de niveau 1 sur les méthodes Biostatistics and d’assurance de la qualité des données a Tier I Canada électroniques sur la santé au Collège de Research Chair médecine Max Rady de l’Université du in Methods for Manitoba. Elle est aussi directrice de la Electronic Health Plateforme de science des données du Cen- Data Quality in tre George & Fay Yee pour l’innovation the Department of dans les soins de santé, une unité de Community Health recherche résultant d’une collaboration en- Sciences, Max Rady tre l’Office régional de la santé de Win- College of Medicine, nipeg et l’Université du Manitoba. Le Cen- University of Man- tre George & Fay Yee vise à renforcer la itoba. She is also recherche ciblée sur le patient au Mani- Director of the Data Science Platform in toba. Son équipe, comportant plus de the George & Fay Yee Centre for Healthcare trente professeurs, membres du personnel Innovation (CHI), a research unit that is a de soutien et stagiaires possédant une ex- collaboration between the Winnipeg health pertise en biostatistique, en bioinformatique region and the University of Manitoba. The et en méthodologie de recherche clinique, CHI aims to strengthen patient-focused est axée sur la recherche méthodologique, research in Manitoba. Her team of 30+ la formation et la consultation. Les do- faculty, staff and trainees with expertise maines d’expertise de Dre Lix comprennent in biostatistics, bioinformatics, and clinical les méthodes pour corriger les biais et les er- research methodology focuses on method- reurs dans les bases de données électroniques ological research, training, and consulting. sur la santé, les méthodes statistiques pour Dr. Lix’s areas of research expertise in- l’analyse d’issues rapportées par le patient clude methods to address bias and error et les méthodes d’analyse pour les données in electronic health databases, statistical longitudinales. Elle est une chercheuse pro- methods for the analysis of patient-reported lifique ayant publié plus de 325 articles sci- outcomes, and methods for the analysis of entifiques. Dr Lix est membre élue du con- longitudinal data. She is a prolific researcher seil d’administration de la Société statis- who has published more than 325 scholarly tique du Canada, présidente de la program- papers. Dr. Lix is an elected member of the mation du Congrès annuel de la SSC de Board of Directors of the Statistical Society 2019, coprésidente du groupe de travail sur of Canada, Program Chair for the Society’s la qualité des données du Système canadien 2019 meeting in Calgary, Co-Chair of the de surveillance des maladies chroniques, et Data Quality Working Group for the Cana- responsable désignée de la programmation dian Chronic Disease Surveillance System, en statistiques appliquées aux politiques de and Program Chair Elect for the 2020 Joint santé à la conférence Joint Statistical Meet- Statistical Meetings Health Policy Statistics ings (JSM) de 2020. Section. 18
Steven Wu Steven Wu a obtenu un B.Math Hon. en Steven Wu fin- statistique de l’Université Carleton, puis une ished his B. Math M.Sc. en statistique de l’Université Simon Hon. in Statistics Fraser. Il a fait le programme co-op à at Carleton Univer- chaque institution. Pour son premier stage, sity and finished his il a été embauché comme testeur manuel MSc Statistics at Si- d’assurance qualité (QA) dans une startup, mon Fraser Univer- puisque sa connaissance de la programma- sity. He did the tion était terrible. La succession de tâches co-op programs at monotones lui a permis de réaliser le pou- both schools, doing voir de la programmation comme outil pour his first work term as a manual QA tester accroı̂tre la productivité. En s’imprégnant at a startup because his programming skills le jour de l’environnement de la haute tech- were terrible. It was in that role of rote tasks nologie, puis en raffinant le soir sa maı̂trise where he realized how powerful program- de Python, Steven a pu développer et met- ming is as a tool for productivity. Absorbing tre en marché une appli permettant aux tech context at day and developing Python entraı̂neurs de basketball dans les univer- programming skills at night, Steven devel- sités canadiennes d’améliorer leurs stratégies oped and marketed a web app that allowed de jeu à l’aide de données et de méthodes Canadian university basketball coaches to statistiques. Les tentatives de la vendre ont inform their game-planning strategies using échoué misérablement, mais l’expérience a data and statistical methods. Attempts to été malgré tout instructive et lui a de plus sell it failed spectacularly but he learned a donné un bon projet à mentionner dans le ton and it made for a great project to talk cadre de sa recherche d’emploi. Il a pos- about when applying for jobs. He inter- tulé auprès de quelques équipes sportives, viewed with a few sports teams, government départements gouvernementaux, et compag- departments, tech companies, and a hedge nies de haute technologie, ainsi qu’auprès fund before accepting a role as a Data Sci- d’un fonds spéculatif avant de dénicher un entist for Shopify’s People Analytics team. poste de spécialiste des données dans l’équipe People Analytics collects and analyzes data People Analytics de Shopify. L’équipe Peo- about the Shopify team to (a) help leadership ple Analytics collecte et analyse des données make data informed decisions and (b) help sur le fonctionnement de Shopify afin d’aider make our workplace more efficient and en- les dirigeants à prendre des décisions basées gaging. We regularly use statistical methods sur les données, et de créer un environnement to influence decisions around hiring, perfor- de travail plus efficace et stimulant. Son tra- mance, retention, engagement, learning, cul- vail statistique influence la prise de décision ture, andmore. en rapport à l’embauche, la performance, la rétention, l’implication, l’apprentissage, la culture, et bien plus. 19
Scientific abstracts: Oral presentations • Résumés sci- entifiques: présentations orales Applications 08:50am - 09:35am, Theatre 4, Michela Panarella (Chair • Présidente) michela.panarella@mail.utoronto.ca Lin, Wei-Hsiang; Lin, Shih-Kuei; Tsai, Cary Chi-Liang Impact of interest rate, surrender, and liquidity risks on the surplus of a portfolio of endow- ment policies using optimal portfolio selection techniques L’effet des risques de taux d’intérêt, de rachat et de liquidité sur le surplus d’un portfolio de polices de dotation résultant de techniques optimales de sélection de portfolios A life insurer charges an endowment pol- Un assureur charge au détenteur d’une po- icyholder high premiums from which the lice de dotation des primes élevées, à par- policyholder’s cash value is built at an tir desquelles se bâtit la valeur en argent interest rate. The life insurer invests the de l’assuré, en fonction d’un certain taux collected premiums in financial securities d’intérêt. L’assureur investit les primes to meet or exceed the interest rate, and collectées dans des produits financiers afin a policyholder can surrender his policy d’atteindre ou d’excéder ce taux d’intérêt. before maturity and get his cash value back L’assuré peut racheter sa police avant ma- subject to a surrender charge. When lots turité et obtenir ainsi sa valeur en argent, of policyholders surrender their policies, moins les frais de rachat. Si un grand nom- the life insurer needs to liquidate some bre d’assurés rachètent leur police, l’assureur securities in a short time, which exposes the doit liquider des actifs financiers en peu de insurer to liquidity risk. In this paper, we temps, créant un risque de liquidité. Dans propose a framework to analyse the impact cet article, nous proposons une méthode of interest rate, surrender, and liquidity risks pour analyser l’effet des risques liés aux taux on the surplus of a portfolio of endowment d’intérêt, aux rachats et à la liquidité sur policies. Under the framework, we formulate les surplus d’un portfolio de polices de dota- the fair premium and risk-based reserves tion. À partir de cette méthode, nous for- calculations. In addition, we adopt optimal mulons les calculs pour un montant de prime portfolio selection methods for maximizing juste et pour les montants de réserve associés utilities. A series of sensitivity analyses are au risque. Nous adoptons également des conducted to illustrate the surplus distribu- méthodes optimales de sélection de portfolios tions and corresponding utilities after the afin de maximiser les utilités. Dans ce con- adoption. texte, nous réalisons un ensemble d’analyses de sensibilité dans le but d’illustrer les distri- butions des surplus et les utilités correspon- dantes. 20
Richard, Dan; Lupul, Nicholas An Application of the Gibbs Sampling to the Battleship Game Une application de l’échantillonnage de Gibbs au jeu Bataille Navale Battleship is a classic two player game Bataille Navale est un jeu très populaire, where the goal is to sink the opponent’s dans lequel deux joueurs visent à couler ships. Programming a winning strategy les bateaux de l’adversaire. Programmer for this game is difficult because the state une stratégie gagnante pour ce jeu est diffi- space representing the possible coordinates cile, car l’espace d’état comprenant les coor- for the opponent’s ships is huge. To solve données possibles des bateaux de l’adversaire this issue, we implemented an algorithm est énorme. Afin de régler ce problème, based on the Gibbs sampling to estimate nous avons implémenté un algorithme basé the probability of each coordinate to contain sur l’échantillonnage de Gibbs (Gibbs sam- a ship. Simulation results regarding the pling) nous permettant d’estimer la proba- number of guesses to sink each ship and to bilité qu’un bateau se trouve à chaque co- complete a game are presented along with ordonnée. Nous présentons les résultats de strategy Insights. simulations en lien au nombre d’essais pour couler chaque bateau et pour compléter le jeu, ainsi que des conseils stratégiques con- nexes. 21
Ansari, Usama; Zhang, Chengkai Statistical analysis of vessel motion patterns in the ports and waterways using Automatic Identification System (AIS) Analyse statistique des mouvements des navires dans les ports et sur les voies navigables en utilisant le système d’identification automatique (SIA) The abstract is devoted to statistical analysis Ce projet est consacré à l’analyse statis- of vessel motion patterns in the ports and wa- tique des mouvements des navires dans les terways using Automatic Identification Sys- ports et sur les voies navigables en util- tem (AIS). AIS is an automatic ship self- isant le système d’identification automa- reporting system used for the maritime trans- tique (SIA). Le SIA est un système automa- portation purpose. The AIS system broad- tique d’autodéclaration des vaisseaux utilisé casts the vessel sailing information like po- pour le transport maritime. Le système sition, speed, status etc... which can be re- SIA diffuse l’information de navigation du ceived by the other ships or Vessel Traffic Ser- navire, telle que la position, la vitesse et le vice (VTS) centers . From the real historic statut, qui peut alors être reçue par d’autres AIS data we extract the trajectory patterns navires ou par les centres de service du trafic which are then used to construct the predic- maritime (STM). À partir de données his- tion models to determine the trajectory of toriques réelles du SIA, nous avons extrait the vessel. The challenges faced unlike the des schémas des trajectoires qui sont en- vehicles have limitations when driving on the suite utilisés pour élaborer des modèles de road, a ship vessel can move from one port prédiction pour déterminer la trajectoire des to the other port with various speeds and dif- navires. Contrairement aux véhicules qui ferent trajectories, which makes it difficult to circulent sur les routes, un navire peut se analyze which port is its destination. The ca- déplacer d’un port à l’autre à différentes pability to accurately forecast the movement vitesses et en employant différentes trajec- of ships globally would potentially enable the toires, rendant difficile de déterminer le port maximization of business trading profits and de destination, ce qui représente un défi. La safety of life at sea. capacité de prédire avec précision le mou- vement des navires pourrait potentiellement permettre la maximisation des profits de commerce et de la sécurité de la vie marine. 22
Robust estimators • Estimateurs robustes 08:50am - 09:35am, O1500, Victoire Michal (Chair • Présidente) victoire.michal@umontreal.ca Di, Wu Construction of D-optimal Designs in Polynomial Regression Models Formulation de plans D-optimaux pour les modèles de régression polynomiale Whenever we have an appropriate statistical Même avec un modèle statistique appro- model, it is crucial to have good estimation of prié, l’estimation des paramètres, bien que the parameters of the model. Optimal design cruciale, peut être difficile. La formula- plays a big role on achieving this objective. tion d’un plan optimal aide à améliorer There are a variety of criteria defining good les estimés obtenus. Il existe une multi- estimation. Motivated by this fact, we con- tude de critères pour quantifier la qualité struct D-optimal designs by minimizing the de l’estimation. Dans cet esprit, nous for- generalized variance of the parameter estima- mulons des plans D-optimaux en minimisant tors of some polynomial regression models. la variance généralisée des estimateurs des In order to construct such designs, we use paramètres de modèles de régression polyno- a class of algorithms, indexed by a function miale. Nous employons un type d’algorithme which depends on the derivatives of the cri- indexé par une fonction dépendant de la terion function. We also attempt to improve dérivée de la fonction critère. Nous ten- the convergence of the algorithm by using the tons également d’améliorer la convergence de properties of the directional derivatives of the l’algorithme en exploitant les propriétés des criterion function. dérivées directionnelles de la fonction critère. 23
Zhang, Weijia; Yang, Po; Muthukumarana, Saman A new design of the continual reassessment method Un nouveau plan d’expérience pour la méthode de réévaluation continue We propose a new design of the continual Nous proposons un nouveau plan reassessment method (CRM) and system- d’expérience pour la méthode de réévaluation atically evaluate its performance on certain continue et évaluons systématiquement operating measures to satisfy the require- sa performance sur certaines mesures ments of collective and individual ethics. opérationnelles pour satisfaire aux exi- We consider the cases of a single drug and a gences éthiques collectives et individu- combination of two drugs. Simulation results elles. Nous considérons le cas d’un seul show that our new method works well over- médicament et celui d’une combinaison all in comparison with currently available de deux médicaments. Les résultats de designs, on criteria BEARS: Benchmark, simulation montrent que notre méthode Efficacy, Accuracy, Safety. Our new design fonctionne bien globalement en comparaison avoids toxic doses while reliably identifying avec les plans d’expérience actuellement the maximum tolerated dose. disponibles, selon les critères de Beers: référence, efficacité, précision et sécurité. Notre nouveau plan d’expérience évite les doses toxiques tout en identifiant de manière fiable la dose maximale tolérée. 24
Van Bussel, Melissa; Castel Sophie; Burr, Wesley Time Series Interpolation Algorithms: An Application to Real-World Data Algorithmes d’interpolation pour séries chronologiques : Application à des données réelles The analysis of complex scientific data ob- L’analyse de données scientifiques complexes served in the form of time series often uses observées sous forme de séries chronologiques the power spectrum as an exploratory tool. fait souvent appel au spectre de puissance Robust estimators of this statistic have ex- comme outil d’exploration. Des estima- isted for some time, but typically require that teurs robustes de cette statistique existent the data set be contiguous, that is, without depuis un certain temps, mais ils requièrent any missing observations. This presents a habituellement que le jeu de données soit problem for many data sets, as observations contigu, c’est-à-dire qu’il n’y ait pas de can be missing for a number of reasons: in- valeurs manquantes. Ceci constitue un strumentation error or fault, data corruption, problème pour plusieurs bases de données, or observational concerns such as interrupted puisque des observations peuvent être man- vision of the observational unit (e.g., satel- quantes pour une foule de raisons: erreurs lites losing data coverage due to cloud cover). ou défauts dans la prise de mesure, corrup- Interpolators for time series aim to repair the tion des données, ou problèmes d’observation original scientific data by inserting estimated tels que l’interruption dans l’observation de values for the missing quantities. In this l’unité, p.ex. un satellite perdant le sig- talk, we will examine the computational nal visuel dû au couvert nuageux. Les in- and performance results for a number of terpolateurs pour les séries chronologiques modern interpolation algorithms, as applied visent à arranger les données scientifiques to various real-world datasets. We conclude originales en insérant des valeurs estimées with recommendations for interpolator pour les quantités manquantes. Dans cette choice based on the structure of the data of présentation, nous examinerons les résultats interest. calculatoires et la performance d’un certain nombre d’algorithmes d’interpolation mod- ernes, appliqués à divers jeux de données réelles. Nous concluons avec des recomman- dations pour le choix d’un interpolateur basé sur la structure des données choisies. 25
Causal inference • Inférence causale 08:50am - 09:35am, 1405B, Thai-Son Tang (Chair • Président) thaison.tang@mail.utoronto.ca Ghosh, Trinetri ; Ma, Yanyuan ; Luna, Xavier de Sufficient dimension reduction for feasible and robust estimation of average causal effect Réduction suffisante de la dimensionnalité pour une estimation réalisable et robuste de l’effet causal moyen When estimating the treatment effect in Pour l’estimation de l’effet du traitement an observational study, we use a semipara- dans une étude observationnelle, nous util- metric locally efficient dimension reduction isons une approche de réduction de di- approach to assess both the treatment mensionnalité semi-paramétrique et efficace assignment mechanism and the average localement. Elle permet l’évaluation du responses in both treated and nontreated mécanisme d’assignation du traitement et de groups. We then integrate all results la réponse moyenne dans les groupes traités through imputation, inverse probability et non-traités. Par la suite, nous intégrons weighting and doubly robust augmentation tous les résultats à l’aide d’estimateurs par estimators. Doubly robust estimators are imputation, par pondération selon la prob- locally efficient while imputation estima- abilité inverse, et par augmentation dou- tors are super-efficient when the response blement robustes. Les estimateurs double- models are correct. To take advantage of ment robustes sont efficaces localement, tan- both procedures, we introduce a shrinkage dis que les estimateurs d’imputation sont estimator to automatically combine the two, super-efficaces si les modèles pour la réponse which retains the double robustness property sont corrects. Afin de tirer avantage des deux while improving on the variance when the approches, nous présentons un estimateur de response model is correct. We demonstrate rétrécissement (shrinkage estimator) les com- the performance of these estimators through binant automatiquement. Il préserve la pro- simulated experiments and a real dataset priété de double robustesse et améliore la concerning the effect of maternal smoking variance quand le modèle pour la réponse est on baby birth weight. correct. Nous démontrons la performance de l’estimateur à partir d’expériences simulées et via l’analyse d’un véritable jeu de données traitant de l’effet du tabagisme maternel sur le poids des enfants à la naissance. 26
Kuan Liu; Olli Saarela; Eleanor Pullenayegum On Bayesian estimation of causal effect with a latent confounder class Estimation bayésienne d’un effet causal en présence d’une classe de confusion latente Despite the practicality, observational studies Malgré leur aspect pratique, les études observa- are subjected to selection and confounding bias tionnelles sont sujettes à du biais de sélection et and often require all confounders to be mea- de confusion. Pour l’inférence d’un lien causal, sured and controlled to infer casual relationship. elles requièrent souvent que tous les facteurs de In practice, it’s difficult to ensure and assume confusion soient mesurés et contrôlés. En pra- all confounders were captured in the data. We tique, il est difficile de s’assurer que tous les fac- consider a causal effect that is confounded by teurs de confusion ont été enregistrés. Nous con- an unobserved latent confounder class. This sidérons dans cette étude un effet causal confus latent class can be viewed as the unobserved par une classe de confusion latente non observée. augmented disease-risk/comorbidity profile On peut considérer cette classe latente comme le that functions as a confounder. The observed profil non observé et augmenté de comorbidité covariates, instead of being treated directly as et de risque de maladie, qui agit en tant que confounders, are categorized into two groups: facteur de confusion. Nous ne traitons pas di- one predicts the latent class (class predictors) rectement les covariables observées comme de and one manifested from the latent class (class simples facteurs de confusion. Nous les subdi- indicators). We assume the unobserved latent visons plutôt en deux groupes: l’une comprend class 1) captures the true confounding informa- les prédicteurs de classe, et l’autre comprend tion, 2) can be sufficiently identified (modeled) les effets découlant de la classe (indicateurs de given the measured covariates and 3) deter- classe). Nous assumons que la classe latente non mines both the treatment and outcome process. observée reflète l’information véritable de confu- Furthermore, conditioning on the latent class, sion, qu’elle puisse être suffisamment identifiée treatment assignment is independent of the po- (modélisée) à l’aide des covariables mesurées, et tential outcomes, which permits a full Bayesian enfin, qu’elle détermine autant le processus de parameterization of the joint distribution of the traitement que celui de réponse. De plus, en treatment model, outcome model and the latent conditionnant sur la classe latente, on obtient class model. Our proposed causal problem is que l’assignation du traitement est indépendante appealing - it features dimension reduction of des réponses potentielles. Ceci permet une the measured covariates through modeling the paramétrisation bayésienne complète de la dis- underlying patient augmented confounding in tribution conjointe du modèle de traitement, de a latent class analysis. The objective of this réponse et de classe latente. Le problème causal presentation is to present the proposed causal que nous abordons est attrayant: il implique problem, share existing literature in causal une diminution de la dimensionnalité des covari- inference with unmeasured (latent) confounder ables mesurées à travers la modélisation, par and discuss the planned Bayesian estimation. une analyse de classe latente, de la confusion augmentée sous-jacente pour le patient. Cette présentation vise à expliquer le problème causal proposé, faire connaı̂tre la littérature existante en inférence causale en présence d’un facteur de confusion (latent) non mesuré, et mettre en lumière l’estimation bayésienne imaginée. 27
Chakraborty, Shubhadeep ; Zhang, Xianyang Distance Metrics for Measuring Joint Dependence with Application to Causal Inference Mesures de distance pour mesurer la dépendance conjointe avec application à l’inférence causale Many statistical applications require the Plusieurs applications statistiques quantification of joint dependence among nécessitent de quantifier la dépendance more than two random vectors. In this work, conjointe d’un ensemble formé de plus de we generalize the notion of distance covari- deux vecteurs aléatoires. Dans nos travaux, ance to quantify joint dependence among nous généralisons la notion de covariance d ≥ 2 random vectors. We introduce the de distance pour quantifier la dépendance high order distance covariance to measure conjointe d’un ensemble formé de d ≥ 2 the so-called Lancaster interaction depen- vecteurs aléatoires. Nous introduisons une dence. The joint distance covariance is then distance de covariance d’ordre supérieur defined as a linear combination of pairwise pour mesurer la soi-disant dépendance distance covariances and their higher order d’interaction de Lancaster. La covariance de counterparts which together completely distance conjointe est ainsi définie comme characterize mutual independence. We une combinaison linéaire des distances de co- further introduce some related concepts variance deux-à-deux et de leurs homologues including the distance cumulant, distance d’ordre supérieur, qui lorsque combinés characteristic function, and rank-based caractérisent complètement la dépendance distance covariance. Empirical estimators mutuelle. Ensuite, nous introduisons cer- are constructed based on certain Euclidean tains concepts connexes, comme le cumulant distances between sample elements. We de la distance, la fonction caractéristique study the large sample properties of the es- de la distance, et la covariance de distance timators and propose a bootstrap procedure basée sur le rang. Des estimateurs em- to approximate their sampling distributions. piriques sont construits à partir de certaines The asymptotic validity of the bootstrap distances euclidiennes entre les éléments de procedure is justified under both the null l’échantillon. Nous étudions les propriétés and alternative hypotheses. The new metrics de ces estimateurs pour des échantillons are employed to perform model selection in de grande taille, et nous proposons une causal inference, which is based on the joint procédure bootstrap pour approximer leur independence testing of the residuals from distribution d’échantillonnage. La validité the fitted structural equation models. The asymptotique de la procédure bootstrap effectiveness of the method is illustrated via est justifiée sous les hypothèses nulle et both simulated and real datasets. alternative. Les nouvelles mesures sont utilisées pour sélectionner un modèle en inférence causale, celui-ci basé sur un test d’indépendance conjointe des résidus tiré de l’ajustement d’un modèle d’équations structurelles. L’efficacité de la méthode est illustrée à l’aide de données simulées et réelles. 28
Model selection • Sélection de modèle 09:40am - 10:25am, 1405B, Thai-Son Tang (Chair • Présidente) thaison.tang@mail.utoronto.ca Kiwon, Francis; Nolet-Gravel, Eloise; Jalbert, Jonathan Frequentist Model Averaging Estimator of Support Vector Machine Classfiers and Regres- sors Estimateur par combinaison de modèles fréquentistes pour les classificateurs et régresseurs par machines à vecteurs de support With its capability of reducing model vari- Grâce à sa capacité à réduire la variance du ance while retaining bias, model averaging modèle tout en limitant le biais, la combinai- presents a captivating alternative to model son de modèles (model averaging) présente selection for tackling model uncertainty. We une alternative captivante à la sélection de propose an application of the Mallows model modèles classique. Nous proposons une ap- averaging (MMA) technique suggested by plication de la technique de combinaison de Hansen (2007), which is based on minimizing modèles de Mallows (CMM), basée sur la the Mallows criterion to a set of support minimisation du critère de Mallows sur un vector machines (SVM), for both classifi- ensemble de machines à vecteurs de support cation and regression. We compared mean (MVS), à la fois pour la classification et pour squared error (MSE) of MMA estimator la régression. Nous avons comparé l’erreur with those of models averaged or selected quadratique moyenne (EQM) de l’estimateur based on the other information criteria CMM avec celle des combinaisons de modèles designed for SVM models by Vapnik (1982) ou des sélections de modèles basés sur and Claeskens (2008). Although there is no d’autres critères d’information conçus pour single dominant approach over a range of les modèles de MVS. Bien qu’il n’y ait sample sizes and signal-to-noise ratios, from pas une seule approche dominante pour une a minimax viewpoint not only is model av- gamme de tailles échantillonnales et de ratio eraging shown to be more competitive than signal sur bruit, d’un point de vue minimax, model selection, but my MMA estimator is la combinaison de modèles s’avère plus per- competitive among its peer model averaging formante que la sélection de modèles. En ter- methods in terms of MSE, especially with mes d’EQM, elle se compare également avan- smaller sample sizes and larger signal-to- tageusement aux méthodes par combinaison noise ratios. Theoretical underpinnings and de modèles analogues, en particulier pour des an illustrative application are also presented. échantillons plus petits et pour des ratios sig- nal sur bruit plus élevés. Des fondements théoriques et une application illustrée sont également présentés. 29
Hoque, Md Rashedul; Sumeet, Kalia Approximation of the Formal Bayesian Model Comparison using the Extended Conditional Pre- dictive Ordinate Criterion Approximation de la comparaison de modèle bayésienne formelle à l’aide du critère des ordonnées étendu, conditionnel et prédictif The optimal method for Bayesian model com- Le facteur de Bayes (FB) formel constitue parison is the formal Bayes factor (BF), accord- la méthode optimale pour la comparaison ing to decision theory. The formal BF is compu- bayésienne de modèles. Le FB formel est tationally troublesome for more complex mod- toutefois gênant sur le plan computationnel els. If predictive distributions under the com- pour les modèles plus complexes. Quand les peting models do not have a closed form, a cross- distributions prédictives pour les modèles en validation idea, called the conditional predic- compétition n’ont pas de forme fermée, on peut tive ordinate (CPO) criterion can be used. In utiliser une idée issue de la validation croisée, the cross-validation sense, this is a ”leave-out dénommée ”le critère de l’ordonnée condition- one” approach. CPO can be calculated directly nelle prédictive” (conditional predictive ordi- from the Monte Carlo (MC) outputs, and the re- nate criterion, OCP). En termes de validation sulting Bayesian model comparison is called the croisée, il s’agit d’une approche leave-one out. pseudo Bayes factor (PBF). We can get closer On peut calculer le critère OCP directement to the formal Bayesian model comparison by in- à partir du résultat de l’algorithme de Monte creasing the ”leave-out size”, and at ”leave-out Carlo (MC). On dénomme ”pseudo-facteur de all” we recover the formal BF. But, the MC er- Bayes” (PFB) la comparaison de modèles en ror increases with increasing ”leave-out size”. In résultant. On peut s’approcher de la compara- this study, we examine this for linear regression ison de modèles formelle bayésienne en aug- models. mentant la ”taille d’exclusion” (leave-out size). Our study reveals that the Bayesian model Si cette taille correspond à toutes les données, comparison can favour a different model for on obtient le FB formel. Cependant, l’erreur PBF compared to BF when comparing two MC augmente en fonction de cette taille. Dans close linear models. So, larger ”leave-out sizes” cette étude, nous analysons ce phénomène pour are preferred which provide result close to the les modèles de régression linéaire. Notre étude optimal BF. On the other hand, MC samples révèle que, dépendant de l’utilisation du FB ou based formal Bayesian model comparisons are du PFB, la comparaison bayésienne de modèles computed with more MC error for increasing peut favoriser un modèle différent en présence ”leave-out sizes”; this is observed by comparing de modèles linéaires similaires. Utiliser une plus with the available closed form results. Still, grande taille d’exclusion est préférable, puisque considering a reasonable error, we can use cela produit un résultat plus proche de celui ”leave-out size” more than one instead of fixing du FB optimal.Toutefois, les comparaisons de it at one. modèles bayésiennes formelles basées sur des échantillons MC produisent une plus grande er- reur quand la taille d’exclusion est grande. Nous remarquons ceci grâce à une comparaison avec des résultats à forme fermée. Malgré tout, si l’erreur reste suffisamment petite, on peut utiliser une taille d’exclusion supérieure à un. 30
You can also read